GenCore version 5.1.6 
Copyright (c) 1993 - 2005 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 
Run on: February 14, 2005, 22:56:12 



; Search time 9798 Seconds 
(without alignments) 
12210.247 Million cell updates/sec 



Title: 

Perfect score: 
Sequence: 



US-10-015-391A-276 
3143 

1 gggctgaggcactgagagac . 



. aaatataaggcttaaaaaaa 3143 



Scoring table: I DENT I T Y_NUC 

Gapop 10.0 , Gapext 1.0 

Searched: 34239544 seqs, 19032134700 residues 

Total number of hits satisfying chosen parameters: 



68479088 



Minimum DB seq length: 
Maximum DB seq length: 



0 

2000000000 



Post-processing: Minimum Match 0% 

Maximum Match 100% 

Listing first 1500 summaries 



Database 



EST:* 
gb 
gb 
gb_ 
gb 
gb 
gb_ 
gb 
gb_ 
gb_ 



estl:* 
est2:* 
htc:* 
est3:* 
est4 : * 
est5 : * 
est6 : * 
gssl : * 
gss2 : * 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 



SUMMARIES 



Result 



% 

Query 



*o. 


Score 


Match 


Length 


DB 


ID 


1 


3005 


95. 


6 


3005 


3 


CR623694 


2 


2927.6 


93. 


1 


3151 


3 


HSM807023 


3 


1874 


59. 


6 


2172 


9 


AY402621 


4 


1765.4 


56. 


2 


2133 


9 


AY402622 


5 


1747.4 


55. 


6 


3206 


3 


AK077976 


6 


1701.4 


54. 


1 


3086 


3 


AK035918 


7 


1372.2 


43. 


7 


2172 


9 


AY402623 


8 


950.6 


30. 


2 


1108 


5 


BX367242 



Description 



CR623694 
BX640891 
AY402621 
AY402622 
AK077976 
AK035918 
AY402623 
BX367242 



f ull-leng 
Homo sapi 
Homo sapi 
Pan trogl 
Mus muscu 
Mus muscu 
Mus muscu 
BX367242 



c 


9 


926.2 


29. 


5 


1064 


5 


BX363741 


BX363741 


BX363741 


c 


10 


874.4 


27. 


8 


922 


5 


BX350606 


BX350606 


BX350606 




11 


849.2 


27. 


0 


934 


5 


BX384966 


BX384966 


BX384966 




12 


839 


26. 


7 


897 


5 


BX328255 


BX328255 


BX328255 




13 


827.4 


26. 


3 


974 


5 


BQ057192 


BQ057192 


AGENCOURT 




14 


820.4 


26. 


1 


944 


5 


BX390196 


BX390196 


BX390196 


c 


15 


779.8 


24. 


8 


797 


6 


CB243787 


CB243787 


UI-CF-FNO 




16 


775 


24. 


7 


801 


5 


BX112994 


BX112994 


BX112994 




17 


769.8 


24. 


5 


912 


5 


BQ883972 


BQ883972 


AGENCOURT 




18 


768 


24. 


4 


958 


5 


BX376660 


BX376660 


BX376660 




19 


757.6 


24. 


1 


892 


6 


CD107028 


CD107028 


AGENCOURT 


c 


20 


756.2 


24. 


1 


819 


6 


CD631371 


CD631371 


56050427H 




21 


748.6 


23. 


8 


951 


5 


BQ056228 


BQ056228 


AGENCOURT 




22 


696.6 


22. 


2 


775 


1 


AU122156 


AU122156 


AU122156 




23 


691.2 


22. 


0 


970 


5 


BQ707628 


BQ707628 


AGENCOURT 




24 


681 


21. 


7 


1066 


4 


BM806752 


BM806752 


AGENCOURT 


c 


25 


675.2 


21. 


5 


763 


6 


CD631373 


CD631373 


56066030H 




26 


674 


21. 


4 


727 


7 


CN255817 


CN255817 


170004252 




27 


673 


21. 


4 


960 


5 


BX367243 


BX367243 


BX367243 




28 


666 


21. 


2 


706 


6 


CD631372 


CD631372 


56050427J 




29 


664 


21. 


1 


681 


7 


CV023527 


CV023527 


4 90 Full 




30 


661.8 


21. 


1 


666 


4 


BG684636 


BG684636 


602635914 




31 


650 


20. 


7 


925 


5 


BQ937439 


BQ937439 


AGENCOURT 


c 


32 


627.4 


20. 


0 


640 


6 


CA311774 


CA311774 


UI-CF-FN0 


c 


33 


612 


19. 


5 


624 


4 


BM666780 


BM666780 


UI-E-CL1- 




34 


609.8 


19. 


4 


1119 


4 


BI550650 


BI550650 


603195823 




35 


608.4 


19. 


4 


803 


7 


CN539797 


CN539797 


UI-M-HU0- 




36 


598.6 


19. 


0 


621 


2 


AW965845 


AW965845 


EST377918 


c 


37 


598.4 


19. 


0 


634 


5 


BU632880 


BU632880 


UI-H-FE1- 


c 


38 


594 


18. 


9 


618 


5 


BU686374 


BU686374 


UI-CF-DU1 




39 


590.8 


18. 


8 


740 


6 


CD631374 


CD631374 


56066030J 




40 


585.2 


18. 


6 


881 


5 


BQ960065 


BQ960065 


AGENCOURT 




41 


579.2 


18. 


4 


720 


6 


CA315771 


CA315771 


UI-M-FW0- 




42 


579 


18. 


4 


580 


5 


BP346261 


BP346261 


BP346261 




43 


576.2 


18. 


3 


582 


5 


BP312448 


BP312448 


BP312448 




44 


568.6 


18. 


1 


783 


7 


CK483764 


CK483764 


AGENCOURT 




45 


566.8 


18. 


0 


582 


5 


BP305311 


BP305311 


BP305311 




46 


565.8 


18. 


0 


571 


7 


CR554650 


CR554650 


DKFZp4590 




47 


557.8 


17. 


7 


796 


5 


BU052878 


BU052878 


UI-M-FC0- 




48 


554.4 


17. 


6 


718 


7 


CK837783 


CK837783 


4063044 B 




49 


552.6 


17. 


6 


917 


6 


CA454892 


CA4548 92 


AGENCOURT 




50 


552.4 


17. 


6 


779 


4 


BI683727 


BI683727 


603306287 




51 


551.4 


17. 


5 


695 


4 


BG685741 


BG685741 


602637838 




52 


547 


17. 


4 


547 


4 


BM128651 


BM128651 


ifl4b09.y 




53 


546.6 


17. 


4 


709 


5 


BQ573544 


BQ573544 


UI-M-FD0- 




54 


542.6 


17. 


3 


667 


4 


BG703963 


BG703963 


602687061 




55 


542.2 


17. 


3 


784 


5 


BQ043061 


BQ043061 


UI-M-EGOp 




56 


538.6 


17. 


1 


841 


6 


CB566426 


CB566426 


AGENCOURT 




57 


530 


16. 


9 


550 


5 


BP292524 


BP292524 


BP292524 




58 


528 


16. 


8 


528 


6 


CA393520 


CA393520 


cs39b03.y 




59 


526.2 


16. 


7 


944 


4 


BI250501 


BI250501 


602993551 




60 


524.4 


16. 


7 


858 


7 


CK022938 


CK022938 


AGENCOURT 


c 


61 


522.4 


16. 


6 


536 


5 


BQ356019 


BQ356019 


PM3-HT130 




62 


510.8 


16. 


3 


793 


4 


BI146386 


BI146386 


602910749 




63 


510 


16. 


2 


666 


2 


BE868099 


BE868099 


601443414 




64 


507.8 


16. 


2 


519 


7 


CK819350 


CK819350 


ifl4b09.y 




65 


500.2 


15. 


9 


532 


4 


BM691378 


BM691378 


UI-E-CI1- 





66 


500.2 


15. 


9 


758 


4 


BI105301 


c 


67 


498 


15. 


8 


567 


1 


AU147813 




68 


495.4 


15. 


8 


628 


7 


CN792080 




69 


494 


15. 


7 


598 


2 


BE588408 




70 


486.6 


15. 


5 


788 


7 


CK481778 




71 


486 


15. 


5 


969 


4 


BG247839 




72 


481.6 


15. 


3 


632 


7 


CK625364 




73 


481 


15. 


3 


481 


4 


BM694992 


c 


74 


478.8 


15. 


2 


503 


1 


AI817099 




75 


478.8 


15. 


2 


810 


6 


CB587284 




76 


476.8 


15. 


2 


544 


4 


BI481387 




77 


470.4 


15. 


0 


530 


1 


AA481246 


c 


78 


469.2 


14. 


9 


562 


2 


AW836429 




79 


467.8 


14. 


9 


821 


5 


BQ442696 




80 


465.4 


14. 


8 


806 


7 


CK481746 




81 


464.6 


14. 


8 


585 


4 


BI359871 




82 


462.6 


14. 


7 


667 


2 


AW914963 




83 


462.2 


14. 


7 


887 


4 


BI219079 




84 


461.4 


14. 


7 


672 


6 


BY747595 




85 


461.2 


14. 


7 


892 


5 


BQ934892 




86 


449.6 


14. 


3 


537 


2 


AW657913 




87 


447 


14. 


2 


872 


4 


BI150290 


c 


88 


446.4 


14. 


2 


450 


1 


AI568200 




89 


444 


14. 


1 


822 


7 


C0565372 




90 


443.8 


14. 


1 


659 


6 


BY747925 


c 


91 


443.4 


14. 


1 


456 


5 


BU726485 


c 


92 


442.4 


14. 


1 


444 


5 


BQ356020 


c 


93 


440.6 


14. 


0 


468 


5 


BQ356018 




94 


439.6 


14. 


0 


578 


4 


BI341318 


c 


95 


436.8 


13. 


9 


440 


1 


AA973640 




96 


435.2 


13. 


8 


579 


4 


BI360284 




97 


432.4 


13. 


8 


621 


9 


CG591258 




98 


431 


13. 


7 


632 


7 


C0581119 




99 


430.8 


13. 


7 


794 


2 


BF578994 




100 


427 


13. 


6 


563 


4 


BM030859 


c 


101 


426.8 


13. 


6 


441 


1 


AA554541 




102 


426.8 


13. 


6 


827 


7 


CO404310 




103 


425.2 


13. 


5 


443 


2 


BF882612 


c 


104 


425.2 


13. 


5 


457 


1 


AI291110 




105 


422.8 


13. 


5 


546 


2 


BF199358 




106 


422.4 


13. 


4 


759 


4 


BG243769 




107 


418.4 


13. 


3 


576 


4 


BI345630 


c 


108 


415 


13. 


2 


415 


1 


AI017230 




109 


415 


13. 


2 


536 


2 


BF199378 


c 


110 


414.6 


13. 


2 


454 


2 


BF882611 




111 


414.6 


13. 


2 


538 


2 


BF080018 


c 


112 


413.6 


13. 


2 


537 


5 


BX372943 




113 


413 


13. 


1 


583 


5 


BP315573 


c 


114 


412.6 


13. 


1 


468 


7 


T34379 




115 


412 


13. 


1 


582 


5 


BP314196 




116 


411 


13. 


1 


581 


5 


BP314893 




117 


410.8 


13. 


1 


624 


4 


BM691301 




118 


409 


13. 


0 


582 


5 


BP312657 




119 


409 


13. 


0 


721 


2 


BF580373 




120 


408 


13. 


0 


473 


7 


H08023 




121 


406 


12. 


9 


406 


7 


CR538178 




122 


405 


12. 


9 


583 


5 


BP314892 



BI105301 602893591 
AU147813 AU147813 
CN792080 4126901 B 
BE588408 194035 BA 
CK4 81778 AGENCOURT 
BG247839 602359548 
CK625364 mi32c08.y 
BM694992 UI-E-CLl- 
AI817099 wj76hll.x 
CB587284 AGENCOURT 
BI481387 H2RPE-174 
AA481246 aa34hll.r 
AW836429 PM3-LT003 
BQ442696 UI-M-EVO- 
CK48174 6 AGENCOURT 
BI359871 384615 MA 
AW914963 EST346267 
BI219079 602938695 
BY747595 BY747595 
BQ934 892 AGENCOURT 
AW657913 93554 MAR 
BI150290 602915311 
AI568200 tn66h01.x 
C0565372 AGENCOURT 
BY747925 BY747925 
BU726485 UI-E-CI1- 
BQ356020 PM3-HT130 
BQ356018 PM3-HT130 
BI341318 368709 MA 
AA973640 oo48c04.s 
BI360284 387146 MA 
CG591258 OST245642 
C0581119 ILLUMIGEN 
BF578994 602096109 
BM030859 495387 MA 
AA554541 nll4b01.s 
CO404310 AGENCOURT 
BF882612 QV3-ET020 
AI291110 qml0d09.x 
BF199358 249500 MA 
BG243769 602357081 
BI345630 374508 MA 
AI017230 ou32dl2.x 
BF199378 249524 MA 
BF882611 QV3-ET020 
BF080018 230753 MA 
BX372943 BX372943 
BP315573 BP315573 
T34379 EST66750 Hu 
BP314196 BP314196 
BP314893 BP314893 
BM691301 UI-E-CI1- 
BP312657 BP312657 
BF580373 602097124 
H08023 yl91d06.rl 
CR538178 DKFZp459F 
BP314892 BP314892 





123 


404.8 


12. 


9 


870 


2 


BE306403 




124 


404.6 


12. 


9 


610 


4 


BG618720 




125 


403.2 


12. 


8 


1122 


2 


BF159534 


c 


126 


402.6 


12. 


8 


449 


1 


AI 623385 




127 


401.4 


12. 


8 


581 


5 


BP357544 




128 


395.4 


12. 


6 


634 


1 


AA646591 




129 


394.8 


12. 


6 


494 


4 


BM288077 




130 


392.4 


12. 


5 


766 


7 


CK478839 




131 


392.2 


12. 


5 


882 


2 


BE571537 




132 


392 


12. 


5 


582 


5 


BP315572 




133 


391.6 


12. 


5 


555 


6 


CB613565 




134 


390.6 


12. 


4 


581 


6 


CB606887 




135 


388.8 


12. 


4 


465 


2 


BF882607 




136 


388 


12. 


3 


618 


6 


CB579294 




137 


387.4 


12. 


3 


544 


4 


BI961174 


c 


138 


387 


12. 


3 


405 


1 


AI221749 




139 


383 


12. 


2 


713 


6 


BY763638 


c 


140 


380.8 


12. 


1 


412 


1 


AA761091 




141 


378 


12. 


0 


598 


1 


AV617761 




142 


377.4 


12. 


0 


535 


5 


BQ552175 




143 


377.2 


12. 


0 


665 


4 


BI151295 


c 


144 


374.4 


11. 


9 


459 


2 


BF154829 


c 


145 


374.4 


11. 


9 


459 


4 


BG949399 




146 


372.4 


11. 


8 


582 


5 


BP314933 




147 


370.6 


11. 


8 


600 


6 


CA530364 




148 


370.2 


11. 


8 


541 


2 


AW654459 


c 


149 


369.4 


11. 


8 


464 


5 


BQ356179 




150 


367.4 


11. 


7 


490 


2 


AW659681 




151 


367 


11. 


7 


516 


2 


BF075002 


c 


152 


366.4 


11. 


7 


369 


2 


AW593031 




153 


363.8 


11. 


6 


368 


1 


AA419534 




154 


363.4 


11. 


6 


513 


4 


BM106299 




155 


360.6 


11. 


5 


742 


6 


CB249229 




156 


356.4 


11. 


3 


583 


5 


BP357148 




157 


355 


11. 


3 


529 


5 


BU698229 


c 


158 


354.4 


11. 


3 


363 


1 


AI221756 




159 


353 


11. 


2 


576 


4 


BI914790 


c 


160 


351.4 


11. 


2 


737 


7 


C0425778 




161 


348 


11. 


1 


360 


7 


T19441 


c 


162 


346 


11. 


0 


358 


1 


AI682007 




163 


344.8 


11. 


0 


502 


5 


BU696522 




164 


344.2 


11. 


0 


623 


2 


BB628588 




165 


343.6 


10. 


9 


424 


2 


AW352877 




166 


340.4 


10. 


8 


552 


2 


AW655294 




167 


338.6 


10. 


8 


449 


5 


BQ336149 




168 


337.2 


10. 


7 


545 


2 


AW654538 




169 


334.8 


10. 


7 


479 


4 


BM088355 




170 


333.2 


10. 


6 


411 


2 


BE859656 




171 


332.2 


10. 


6 


443 


2 


AW355069 




172 


327.4 


10. 


4 


700 


5 


BM944176 


c 


173 


326.8 


10. 


4 


330 


7 


CK819349 




174 


321.8 


10. 


2 


469 


1 


AJ650325 




175 


321.2 


10. 


2 


445 


2 


AW481698 




176 


320.6 


10. 


2 


433 


2 


AW355070 




177 


318.6 


10. 


1 


390 


6 


CB778065 




178 


318.4 


10. 


1 


432 


2 


BF019645 


c 


179 


316.8 


10. 


1 


353 


2 


AW628784 



BE306403 601102295 
BG618720 602645175 
BF159534 601769029 
AI623385 tsl8g03.x 
BP357544 BP357544 
AA646591 ve46d08.r 
BM288077 528964 MA 
CK478839 AGENCOURT 
BE571537 601333983 
BP315572 BP315572 
CB613565 AMGNNUC : N 
CB6068 87 AMGNNUC :N 
BF882607 QV3-ET020 
CB579294 AMGNNUC :N 
BI 9 6117 4 MON01_7_A 
AI221749 qg93f04.x 
BY763638 BY763638 
AA761091 nyl3gll.s 
AV617761 AV617761 
BQ552175 H4013H07- 
BI151295 602917272 
BF154829 PM2-BT076 
BG949399 PM2-BT076 
BP314933 BP314933 
CA530364 9034-81 M 
AW654459 103930 MA 
BQ356179 PM3-HT130 
AW659681 97213 MAR 
BF075002 223731 MA 
AW593031 hg07el0.x 
AA419534 zv03c09.r 
BM106299 509997 MA 
CB249229 UI-M-FCO- 
BP357148 BP357148 
BU698229 LL2inl365 
AI221756 qg93fl2.x 
BI914790 603184176 
C0425778 UI-M-HUO- 
T19441 f03002s Tes 
AI682007 tp45g08.x 
BU696522 LL2inl072 
BB628588 BB628588 
AW352877 35717 MAR 
AW655294 106095 MA 
BQ336149 PM0-MT042 
AW654538 104068 MA 
BM088355 501805 MA 
BE859656 UI-M-ALO- 
AW355069 37338 MAR 
BM944176 UI-M-EHOp 
CK819349 ifl4b09.x 
AJ650325 AJ650325 
AW481698 37332 MAR 
AW355070 37337 MAR 
CB778065 AMGNNUC :C 
BF019645 uxl4b02.y 
AW628784 hi39e03.x 



180 


316.2 


181 


315.8 


182 


312.4 


183 


310.6 


184 


310 


185 


308.4 


186 


308 


187 


302.6 


188 


302 


189 


301 


190 


299.8 


191 


298.6 


192 


298.4 


193 


293.6 


194 


293.6 


195 


293.6 


196 


293.2 


197 


293 


198 


289. 6 


199 


288.8 


200 


288.2 


201 


287.6 


202 


287.2 


203 


286.6 


204 


286.4 


205 


285.8 


206 


285.8 


207 


285.6 


208 


284.4 


209 


283.6 


210 


280.6 


211 


279.4 


212 


279 


213 


273.6 


214 


273. 4 


215 


273 


216 


271.4 


217 


269.4 


218 


261.6 


219 


261.2 


220 


257.4 


221 


257.2 


222 


255 


223 


253 


224 


248.8 


225 


248.6 


226 


247.8 


227 


247.4 


228 


247.2 


229 


244 


230 


241.4 


231 


241 


232 


240.6 


233 


239 


234 


234.8 


235 


233.6 


236 


233.2 



10.1 


465 


10.0 


469 


9.9 


443 


9.9 


346 


9.9 


356 


9.8 


310 


9.8 


456 


9.6 


514 


9.6 


388 


9.6 


582 


9.5 


717 


9.5 


583 


9.5 


437 


9.3 


435 


9.3 


480 


9.3 


512 


9.3 


303 


9.3 


439 


9.2 


689 


9.2 


318 


9.2 


368 
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CR623694 3005 bp mRNA linear HTC 21-JUL-2004 

full-length cDNA clone CS0DL005YC17 of B cells (Ramos cell line) 
Cot 25-normalized of Homo sapiens (human) . 
CR623694 

CR623694. 1 GI: 50504501 
HTC; CNSLT_cDNA. 
Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 3005) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished 

Contact : Feng Liang Email : fliang@lifetech.com URL : 
http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue 

2 (bases 1 to 3005) 
Genoscope . 

Direct Submission 

Submitted (20- JUL-2004 ) Genoscope - Centre National de Sequencage : 
BP 191 91006 EVRY cedex - FRANCE (E-mail : seqref@genoscope.cns.fr 
- Web : www.genoscope.cns.fr) 

1st strand cDNA was primed with a Notl-oligo (dT ) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies , a 
division of Invitrogen. 

Location/Qualifiers 

1. .3005 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon:9606" 
/ clone= " CS ODLO 0 5 YC 1 7 " 

/tissue type="B cells (Ramos cell line) Cot 25-normalized" 
/plasmid="pCMVSPORT_6" 



ORIGIN 



Query Match 95.6%; Score 3005; DB 3; Length 3005; 

Best Local Similarity 100.0%; Pred. No. 0; 



Matches 3005; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



Qy 99 CTGAGCATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTC 158 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 CTGAGCATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTC 60 

Qy 159 TTCCAACTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCC 218 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 61 TTCCAACTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCC 120 

Qy 219 ATGCCC AGGGTCAGATACTAT GCAGGGGAT GAAC GT AGGGCACT T AGCTT CT T CCAC CAG 278 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 AT GCCCAGGGTCAGATACT AT GCAGGGGAT GAACGT AGGGCACTTAGCTT CTT CCAC CAG 18 0 

Qy 279 AAGGGCCTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTG 338 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 181 AAGGGCCT CCAGGATTTT GAC ACT CTGCT C CT GAGT GGT GAT GGAAAT ACT CT CT AC GTG 240 

Qy 339 GGGGCTCGAGAAGCCATTCTGGCCTTGGATATCCAGGATCCAGGGGTCCCCAGGCTAAAG 398 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 GGGGCTCGAGAAGCCATTCTGGCCTTGGATATCCAGGATCCAGGGGTCCCCAGGCTAAAG 300 

Qy 399 AACAT GATACCGT GGC CAGC CAGT GACAGAAAAAAGAGT GAATGT GC CTTTAAGAAGAAG 458 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 AACAT GAT ACCGT GGCCAGC CAGT GACAGAAAAAAGAGT GAATGT GC CT TTAAGAAGAAG 360 

Qy 459 AGCAATGAGACACAGTGTT T CAACTT CAT C C GT GT C CT GGTTTCTT ACAAT GT CACC CAT 518 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 361 AGCAATGAGACACAGT GTTT CAACTT CAT C C GT GT C CT GGTTT CTT ACAAT GT CAC CC AT 420 

Qy 519 CTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGAT 578 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 CTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGAT 480 

Qy 579 T C CT ACCT GTT GC CCAT CT C GGAGGACAAGGT CAT GGAGGGAAAAGGC CAAAGCC C CTTT 638 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 TCCTACCTGTTGCCCATCTCGGAGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTT 540 

Qy 639 GACCCCGCTCACAAGCATACGGCTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATG 698 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 GACCCCGCT CACAAGCAT AC GGCT GT CTT GGT GGAT GGGAT GCT CTAT TCT GGTACT ATG 600 

Qy 699 AACAACTTCCTGGGCAGTGAGCCCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTC 758 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 AACAACTTCCTGGGCAGTGAGCCCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTC 660 

Qy 759 AAGACCGACAACT T C CT C C GCTGGCT GCAT CAT GAC GCCT CCTT T GT GGC AGC CAT C C CT 818 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 AAGACCGACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCT 720 

Qy 819 TC GAC CCAGGTCGT CT ACTT CTTCTT CGAGGAGACAGCCAGC GAGTTT GACTT CTT T GAG 878 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 TCGACCCAGGTCGTCTACTTCTTCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAG 780 

Qy 879 AGGCT CC ACACAT CGCGGGT GGCT AGAGT CT GCAAGAAT GACGT GGGC GGCGAAAAGCTG 938 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 781 AGGCT CCACACAT CGCGGGT GGCT AGAGT CT GCAAGAAT GAC GTGGGCGGCGAAAAGCTG 840 
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Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



939 CTGCAGAAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAG 998 

I I I I I I I I I I I I I I I I I I I II I I I I I I 1 II I II I I I I I I II I I I I I I I I I I I I I I I I I I I 

841 CTGCAGAAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAG 900 

999 CTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCC 1058 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

901 CTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCC 960 

1059 CACATCTACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTT 1118 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

961 CACATCTACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTT 1020 

1119 TGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTTTAAGGGGAAATACAAAGAGTTGAAC 1178 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1021 TGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTTTAAGGGGAAATACAAAGAGTTGAAC 1080 

1179 AAAGAAACTTCAC GCT GGACTACTT AT AGGGGC C CT GAGAC CAAC C C C CGGC C AGGC AGT 1238 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1081 AAAGAAACTTCACGCT GGACTACTT AT AGGGGCC CT GAGAC CAAC C C C C GGC CAGGCAGT 1140 



1239 



1298 



TGCTCAGTGGGCCCCTCCTCTGATAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 T GCT CAGT GGGC C CCT CCT CT GATAAGGC CCT GAC CT T CAT GAAGGAC CAT T T CCT GAT G 1200 



1299 



1358 



GATGAGCAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1201 GATGAGCAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTT 1260 

1359 GCAGT GGAGAC AGCCCAGGGCCTT GAT GGGC AC AGC CAT CT T GT CAT GT AC CT GGGAAC C 1418 

I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
1261 GCAGT GGAGACAGCC CAGGGCCTT GAT GGGCACAG C CAT C TT GT CAT GT AC CT GGGAAC C 1320 

1419 ACCACAGGGTCGCTCCACAAGGCT GTGGTAAGT GGGGACAGCAGT GCT CATCT GGTGGAA 1478 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 ACCACAGGGTCGCTCCACAAGGCT GTGGTAAGTGGGGACAGCAGT GCT CAT CT GGT GGAA 1380 

1479 GAGATTCAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAG 1538 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 GAGATTCAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAG 144 0 



1539 



1598 



GGTGCAGTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 GGTGCAGTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGT 1500 

1599 GTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCT 1658 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 GTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCT 1560 

1659 GAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATG 1718 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
1561 GAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATG 1620 

1719 GAGCGGGGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCT 1778 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

1621 GAGCGGGGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCT 1680 
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Db 

Qy 

Db 

Qy 

Db 
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Qy 
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Qy 
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Qy 
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Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1779 CAGAGC CGC CCGCAAAT CATTAAAGAAGT CCTGGCT GT C C C CAACT C CAT C CT GGAG CT C 1838 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 CAGAGCCGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTC 1740 

1839 CCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTC 1898 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 CCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTC 1800 

1899 CCAGAAGCCT CTT CCACT GTCTACAAT GGCT CCCT CTT GCT GAT AGT GC AGGAT GGAGTT 1958 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 CCAGAAGC CT CTTCCACT GT CT ACAAT GGCT CCCT CTT GCT GAT AGT GCAGGAT G GAGTT 1860 

1959 GGGGGTCTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTAC 2018 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 GGGGGTCTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTAC 1920 

2019 TGGGTGGACAGCCAGGACCAGACCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGG 2078 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 T GGGTGGACAGCCAGGACCAGACCCT GGC C CT GGAT CCT GAACT GGCAGGCAT CC C C C GG 1980 

2079 GAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGC CGC CCT GGCT GCCCAGCAG 2138 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 GAGC AT GT GAAGGT CCC GTT GACCAGGGT CAGT GGT GGGGC C GCC CT GGCT GCC CAGCAG 2040 

2139 TCCTACTGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCC 2198 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2041 TCCTACTGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCC 2100 

2199 CTCATCATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGC 2258 

I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

2101 CTCATCATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGC 2160 

2259 T GT GAGAC C CTGCGCCCT GGGGAGAAGGC CC CGTTAAGCAGAGAGCAACAC CT C CAGT CT 2318 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
2161 T GT GAGAC CCTGCGCC CT GGGGAGAAGGCCC CGTTAAGCAGAGAGCAACACCT C CAGT CT 2220 

2319 CCCAAGGAATGCAGGACCTCTGCCAGTGATGTGGACGCTGACAACAACTGCCTAGGCACT 2378 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 CCCAAGGAAT GCAGGACCT CT GCC AGTGAT GT GGAC GCT GACAACAACT GC CT AGGCACT 2280 



2379 



2438 



GAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2281 GAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGG 2340 

2439 CT GGGCGGC C CAAGCAC AGC CCT GACT AGGAT GACAGCAGCACAAAAGAC CAC CT TT CT C 24 98 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2341 CT GGGCGGC CCAAGCACAGC CCT GACTAGGAT GACAGCAGCACAAAAGAC CAC CT T T CT C 2400 

2499 CCCT GAGAGGAGCTT CT GCTACT CT GCAT CACT GAT GACACT CAGCAGGGT GATGC ACAG 2558 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
2401 C C CTGAGAGGAGCTTCT GCTACT CT GCAT CACT GAT GACACT CAGCAGGGT GAT GCACAG 24 60 



2559 



2618 



CAGT CTGC CTCCCCTATGGGACTC CCTT CT AC CAAGCAC AT GAGCT CTCTAACAGGGTGG 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2461 CAGTCTGCCTCCCCTATGGGACTCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGG 2520 

2619 GGGCTACCCC CAGAC CT GCTCCT ACACT GAT ATT GAAGAAC CTGGAGAGGAT CCT T CAGT 2678 



2521 GGGCT ACCC CCAGAC CT GCT CCTAC ACT GAT ATT GAAGAAC CT GGAGAGGAT C CTT CAGT 2580 



Qy 2679 T CT GGC CATT C CAGGGAC C CT C CAGAAACAC AGT GTTT CAAGAGAC C CTAAAAAAC CT GC 2738 

II I I I I I II I I I I I I I II I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 2581 T CT GGC CATT C C AGGGACC CT CCAGAAACACAGT GTTT CAAGAGAC C CTAAAAAAC CT GC 2640 

Qy 2739 CTGTCCCAGGACCCTATGGTAATGAACACCAAACAT CTAAACAATCATAT GCTAACATGC 2798 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 CTGT CCCAGGAC C CTATGGTAATGAACACCAAACAT CTAAACAAT CAT AT GCTAACAT GC 2700 

Qy 2799 CACTCCTGGAAACTCCACTCTGAAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAG 2858 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2701 CACT C CT GGAAACT CCACT CT GAAGCT GCC GCTT T GGAC AC CAAC ACT C C CT T CT C CCAG 2760 

Qy 2859 GGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCA 2918 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2761 GGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCA 2820 

Qy 2919 GGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGAT 2978 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2821 GGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGAT 2 880 

Qy 2979 CCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAG 3038 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2881 CCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAG 2940 

Qy 3039 CTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTG 3098 

I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2941 CTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTG 3000 

Qy 3099 TCAGA 3103 

I I I I I 

Db 3001 TCAGA 3005 
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FEATURES Location/Qualifiers 
source 1. .3151 

/organism="Homo sapiens" 
/mol_type="mRNA" 

/db_xref="RZPD:DKFZp686D04248Q" 
/db_xref="taxon:9606" 
/ clone= " DKFZp 686D04248" 
/tissue_type="salivary gland" 

/clone_lib="686 (synonym: hlcc3) . Vector pSportl_Sfi; host 

DH10B; sites SfilA + SfilB" 

/dev_stage="adult" 

/note="Semaphorin B, differentially spliced, alternative 
start" 

gene 1. .3151 

/ gene= " DKFZp 6 86D04248" 
CDS 217. .2388 

/ gene= " DKFZp 6 86D04248" 

/codon_start=l 

/product="hypothetical protein" 
/protein_id="CAE45942.1" 
/db_xref="GI : 34365196" 
/db_xref="UniProt/TrEMBL:Q6MZT6" 

/ translation="MPRVRYYAGDERRALSFFHQKGLQDFDTLLLSGDGNTLYVGARE 
AILALDIQDPGVPRLKNMIPWPASDRKKSECAFKKKSNETQCFNFIRVLVSYNVTHLY 
TCGTFAFS PACT FI ELQDS YLLP I S EDKVMEGKGQS P FDPAHKHTAVLVDGML YS GTM 
NNFLGSEPILMRTLGSQPVLKTDNFLRWLHHDASFVAAIPSTQWYFFFEETASEFDF 
FERLHTSRVARVCKNDVGGEKLLQKKOTTFLKAQLLCTQPGQLPFl^IRHAVLLPADS 
PTAPHIYAVFTSQWQVGGTRS SAVCAFSLLDIERVFKGKYKELNKETSRWTTYRGPET 
NPRPGSCSVGPSSDKALTFMKDHFLMDEQVVGTPLLVT<SGVEYTRLAVETAQGLDGHS 
HLVMYLGTTPGSLHKAWSGDSSAHLVEEIQLFPDPEPVRNLQLAPTQGAVFVGFSGG 
WRVPRANCSWESCVTICVLARDPHCAWDPESRTCCLLSAPNLNSWKQDMERGNPEWA 
CASGPMSRSLRPQSRPQIIKEVLAVPNSILELPCPHLSALASYYWSHGPAAVPEASST 
VYNGSLLLIVQDGVGGLYQCWATENGFS YPVI S YWVDSQDQTLALDPELAGI PREHVK 
VP LTRVS GGAALAAQQ S YWPH FVTVT VL FALVLS GAL 1 1 LVAS P L RAL RARGKVQGCE 
TLRPGEKAPLSREQHLQSPKECRTSASDVDADNNCLGTEVA" 

ORIGIN 

Query Match 93.1%; Score 2927.6; DB 3; Length 3151; 

Best Local Similarity 99.7%; Pred. No. 0; 

Matches 2933; Conservative 0; Mismatches 9; Indels 0; Gaps 0; 

Qy 202 GAGGC GGGCAGGGGC CCATGC CCAGGGT C AGAT ACT ATGC AGGGGAT GAAC GT AGGGCAC 261 

I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I M 1 I I I 

Db 200 GT GGCT GAGCATGGCCCATGCCCAGGGTCAGAT ACT AT GC AGGGGAT GAAC GT AGGGCAC 259 



Qy 262 TTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATG 321 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I M 

Db 260 TT AGCTT CTT C CAC CAGAAGGGCCT CCAGGAT T T T GACACT CTGCT C CT GAGT GGT GAT G 319 



Qy 322 GAAAT ACT CT CT AC GT GGGGGCT C GAGAAGC CATT CT GGC CTT GGAT AT C CAGGAT CCAG 381 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 1 I I I I I I I I I I I I I I 
Db 320 GAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGGCCTTGGATATCCAGGATCCAG 379 

Qy 382 GGGT CCCCAGGCTAAAGAACAT GAT ACC GT GGC CAGC CAGT GACAGAAAAAAGAGTGAAT 441 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 38 0 GGGT CCC CAGGCTAAAGAACAT GAT ACC GT GGC C AG C CAGT GACAGAAAAAAGAGT GAAT 439 

Qy 442 GTGCCTTTAAGAAGAAGAGCAATGAGACACAGT GTTTCAACTTCAT CCGTGT CCT GGTTT 501 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I 
Db 440 GTGCCTTT AAGAAGAAGAGCAAT GAGAC ACAGTGT T T CAACTTCAT CCGT GT CCT GGTTT 499 

Qy 502 CTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCT 561 

Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 500 CTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCT 559 

Qy 562 T C AT TGAACTTCAAGATT CCTACCT GTTGC C C AT CT C GGAGGACAAGGT CAT GGAGGGAA 621 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II II I I I I I I 
Db 560 TCATTGAACTTCAAGATTCCTACCTGTTGCCCAT CT CGGAGGACAAGGTCAT GGAGGGAA 619 

Qy 622 AAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGTGGATGGGATGC 681 

I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 620 AAGGC CAAAGCC C CTTT GACC CC GCT CACAAGCAT ACGGCT GT CT T GGTGGAT GGGAT GC 679 

Qy 682 T CT ATT CT GGTACTAT GAACAACTT C CTGGGCAGT GAGCCCAT CCT GAT GC GCACACT GG 741 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 680 TCTATTCT GGTACTAT GAACAACTTC CTGGGCAGT GAGCCCAT CCT GATGC GCACACT GG 739 

Qy 742 GATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCT 801 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 740 GAT C CCAGCCTGT C CTCAAGACCGACAACTT C CT CCGCT GGCTGCAT CAT GAC GC CT C CT 799 

Qy 802 TTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGAGGAGACAGCCAGCG 861 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 800 TT GT GGCAGC CAT CC CTT CGAC C C AGGT CGT CTACTT CT T CTTC GAGGAGACAGC C AGCG 859 

Qy 862 AGTTTGACTT CTTT GAGAGGCT C C ACACAT CGCGGGT GGCTAGAGT CT GCAAGAAT GACG 921 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 860 AGTTTGACTT CTTT GAGAGGCT CCACACAT CGCGGGT GGCTAGAGT CT GCAAGAAT GAC G 919 

Qy 922 TGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCT 981 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 920 TGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCT 97 9 

Qy 982 GCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCG 1041 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 980 GCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCG 1039 

Qy 1042 ATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGA 1101 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1040 ATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGA 1099 

Qy 1102 CCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTTTAAGGGGA 1161 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1100 CCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTTTAAGGGGA 1159 



Qy 1162 AATACAAAGAGTTGAACAAAGAAACTTCACGCTGGACTACTT AT AGGGGC C CT GAGAC CA 1221 



1160 AAT ACAAAGAGTT GAACAAAGAAACTT CACGCT GGACTACTTAT AGGGGC CCT GAGACCA 1219 



Qy 1222 ACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGATAAGGCCCTGACCTTCATGA 1281 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I M M M I I I I 

Db 1220 ACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGATAAGGCCCTGACCTTCATGA 1279 

Qy 1282 AGGACCATTT CCT GAT GGATGAGCAAGT GGT GGGGAC GC CC CTGCT GGT GAAAT CT G GC G 1341 

I I I I I I I I I I I I I I I I I I II I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1280 AGGACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCG 1339 

Qy 1342 T GGAGT ATACAC GGCTTGCAGT GGAGACAGCCCAGGGCCTT GAT GGGCAC AGC CAT CTT G 1401 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1340 T GGAGT AT ACACGGCTTGCAGT GGAGACAGCCCAGGGCCTT GAT GGGCACAGCCAT CTTG 1399 

Qy 1402 T CATGT ACCT GGGAACCAC CACAGGGTCGCT C C ACAAGGCT GT GGTAAGT GGGGACAGC A 1461 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1400 TCATGTACCTGGGAACCACCCCAGGGTCGCTCCACAAGGCTGTGGTAAGTGGGGACAGCA 1459 

Qy 1462 GT GCT CAT CTGGT GGAAGAGATT CAGCT GTT C C CT GAC C CT GAAC CT GTT C GCAACCT GC 1521 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1460 GTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGC 1519 

Qy 1522 AGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGC 1581 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1520 AGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGC 1579 

Qy 1582 CC CGAGC CAACT GTAGT GT CTATGAGAGCT GT GT GGACT GT GT CCT T GCC C GGGACC C C C 1641 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1580 CCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCC 1639 

Qy 1642 ACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACT 1701 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1640 ACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACT 1699 

Qy 1702 C CTGGAAGC AGGACAT GGAGC GGGGGAACC CAGAGT GGGCAT GT GCCAGT GGC CCCATGA 1761 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1700 C CT GGAAGCAGGACAT GGAGC GGGGGAACC CAGAGT GGGCAT GT GCCAGT GGC CCC AT GA 1759 

Qy 1762 GCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCA 1821 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1760 GCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCTA 1819 

Qy 1822 ACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTC 1881 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1820 ACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTC 1879 

Qy 1882 ATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGA 1941 

I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1880 ATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGA 1939 

Qy 1942 TAGTGCAGGATGGAGTTGGGGGTCT CTAC CAGT GCT GGGCAACT GAGAAT GGCTTTT CAT 2001 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1940 TAGT GCAGGATGGAGTTGGGGGTCTCT AC CAGT GCT GGGCAACT GAGAAT GGCTTTT CAT 1999 

Qy 2002 ACCCTGTGATCT C CT ACT GGGT GGACAGC CAGGAC CAGACC CT GGCC CT GGAT CCT GAAC 2061 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 2000 ACCCT GT GAT CT CCTACT GGGT GGACAGC CAGGAC CAGAC C CT GGCC CT GGAT C CT GAAC 2059 

Qy 2062 TGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCG 2121 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I ! I I I I I I I 
Db 2060 TGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCG 2119 

Qy 2122 CCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCT 2181 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2120 CCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCT 2179 

Qy 2182 TAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTC 2241 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I II I I I M I I I I 

Db 2180 TAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTC 2239 

Qy 2242 GGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGCAGAG 2301 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2240 GGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGCAGAG 2299 

Qy 2302 AGCAACAC CT CCAGT CT CCCAAGGAATGCAGGAC CTCT GCC AGT GAT GTGGAC GCT GACA 2361 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2300 AGCAACACCTCCAGT CTCCCAAGGAATGCAGGAC CTCT GC C AGT GAT GTGGACGCTGACA 2359 

Qy 2362 ACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAG 2421 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2360 ACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAG 2419 

Qy 2422 GCACCTGGCCATGCT GGCT GGGCGGCCCAAGC ACAGC C CT GACT AGGAT GACAGC AGCAC 2481 

I I I I I II I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2420 GCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCTGACTAGGATGACAGCAGCAC 247 9 

Qy 2482 AAAAGACCACCTTT CTCC C CT GAGAGGAGCTT CTGCT ACT CT GCATCACT GAT GACACTC 2541 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2480 AAAAGAC CAC CTTT CTCC C CT GAGAGGAGCT T CT GCT ACT C T GCAT CACT GAT GACACT C 2539 

Qy 2542 AGCAGGGT GATGCACAGCAGT CTGC CT CC CCT AT GGGACT C C CTT CT ACCAAGCACAT GA 2601 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2540 AGCAGGGT GAT GCACAGCAGT CT GC CT C C CCT AT GGGACT C C CTT CTACCAAGCACAT GA 2599 

Qy 2602 GCTCT CTAACAGGGT GGGGGCTACCCC CAGAC CTGCT CCTACACT GAT ATT GAAGAAC CT 2661 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2600 GCTCT CTAACAGGGT GGGGGCTACCCC CAGAC CT GCT C CT AC ACT GAT ATT GAAGAAC CT 2659 

Qy 2662 GGAGAGGAT CCTTCAGTT CT GGCCATT C C AGGGAC CCT CCAGAAACAC AGT GT TT CAAGA 2721 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 2660 GGAGAGGATCCTTCAGTTCT GGCCATT C CAGGGAC CCT CCAGAAACACAGT GTTT CAAGA 2719 

Qy 2722 GACCCTAAAAAACCTGCCT GT C CCAGGACCCT AT GGTAAT GAAC ACCAAACAT CTAAACA 2781 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2720 GACCCTAAAAAACCT GCCT GT CCC AGGAC C CT AT GGTAAT GAAC AC CAAAC AT CTAAACA 2779 

Qy 2782 ATCATATGCTAACATGCCACTCCTGGAAACTCCACTCTGAAGCTGCCGCTTTGGACACCA 2841 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2780 AT CAT AT GCTAACAT GCCACTC CT GGAAACTC CACTCT GAAGCT GCC GCTT TGGAC ACCA 2839 



Qy 2842 ACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCAGTCG 2901 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2840 ACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCAGTCG 2899 



Qy 2902 T GCACCGCT GACT C CCAGGAAGTCTTT C CTGAAGT CT GAC CAC CTT T CTT CTT GCTT CAG 2961 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2900 TGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCTTCAG 2959 

Qy 2962 TTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCCTTCT 3021 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I II I I I I I I I I I I II I II 
Db 2960 TTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCCTTCT 3019 

Qy 3022 TCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGG 3081 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II 
Db 3020 TCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGG 3079 

Qy 3082 ATT CAGAAAACT GCTT GT CAGAGACTGT T TAT T TT T TAT TAAAAAT ATAAGGCTTAAAAA 3141 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 308 0 ATT CAGAAAACT GCTT GTCAGAGACTGTTTATTTTTTATTAAAAAT ATAAGGCTTAAAAA 3139 

Qy 3142 AA 3143 

I I 

Db 3140 AA 3141 
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AY402621 2172 bp DNA linear GSS 12-DEC-2003 

Homo sapiens HCM1285 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY402621 

AY402621.1 GI: 39758607 
GSS. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 2172) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 2172) 

Clark,A.G., Glanowski, S . , Nielson,R., Thomas, P., Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualif iers 

1. .2172 

/organism="Homo sapiens" 
/mol_type=" genomic DNA" 



/db_xref="taxon: 9606" 
gene <1. .>2172 

/locus_tag="HCM1285" 

ORIGIN 

Query Match 59.6%; Score 1874; DB 9; Length 2172; 

Best Local Similarity 86.3%; Pred. No. 0; 

Matches 1874; Conservative 0; Mismatches 298; Indels 0; Gaps 0; 

Qy 105 ATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAA 164 

I I I II I I I I I I I I I I I 1 I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAA 60 

Qy 165 CTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCC 224 

I I I I II I I II I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 CTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCC 120 

Qy 225 AGGGT C AGATACTATGCAGGGGAT GAACGTAGGGC ACT T AGCTT CTT C C AC CAGAAGGGC 284 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 AGGGT CAGATACTATGCAGGGGATGAACGTAGGGCACTTAGCTT CTT CC AC CAGAAGGGC 180 

Qy 285 CTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCT 344 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCT 240 

Qy 345 CGAGAAGCCATT CT GGC CTT GGAT ATC C AGGAT C CAGGGGT CC C CAGGCT AAAGAACAT G 404 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CGAGAAGCCATT CT GGCCTT GGAT ATC CAGGAT C CAGGGGT C C C C AGGCTAAAGAAC AT G 300 

Qy 405 AT AC CGT GGCCAGC CAGT GACAGAAAAAAGAGT GAAT GT GC CT T T AAGAAGAAGAGC AAT 4 64 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 301 AT ACC GT GGCCAGC CAGT GACAGAAAAAAGAGT GAAT GT GC CT T T AAGAAGAAGAGCAAT 360 

Qy 4 65 GAGACACAGTGTTT CAACTTCATCCGTGTCCTGGTTT CTTACAAT GTCACCCAT CT CTAC 524 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GAGACACAGTGTTT CAACTTCATCCGTGTCCTGGTTTCTTACAAT GTCACCCATCT CTAC 420 

Qy 525 ACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTAC 584 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 ACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTAC 4 80 

Qy 585 CT GTTGC CCAT CT C GGAGGACAAGGT CATGGAGGGAAAAGGC CAAAGC C C CT TT GACC C C 644 

II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I 

Db 481 CTGTTGCCCATCTCGGAGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCC 540 

Qy 645 GCTCACAAGCATACGGCTGTCTTGGTGGATGGGATGCTCTATT CT GGTACTATGAACAAC 704 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 GCT CACAAGCAT AC GGCTGTCTT GGTGGATGGGAT GCT CT ATT CT G GT ACT AT GAACAAC 600 

Qy 705 TT C CTGGGCAGTGAGCCCATC CTGATGC GCACACTGGGAT C CCAGCCT GT C CT CAAGAC C 764 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 601 TTCCTGGGCAGT GAGCCCAT CCTGATGC GCACACT GGGAT C C CAGCCT GT C CT CAAGAC C 660 



Qy 

Db 



765 GACAACTTCCTCCGCTGGCTGCAT CAT GACGCCTCCTTTGTGGCAGC CAT CCCTTC GACC 824 

I I I I I I I I I I I I I I I I I I I I I I I I I 

661 GACAACTTCCTCCGCTGGCTGCATCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 720 



Qy 825 CAGGTCGTCTACTTCTTCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTC 884 

Db 721 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 780 

Qy 885 CAC ACAT C GC GGGT GGCTAGAGT CT GCAAGAAT GAC GT GGG CGGC GAAAAGCT GCT GC AG 944 

Db 781 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 840 

Qy 945 AAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCC 1004 

Db 841 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 900 

Qy 1005 TTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATC 1064 

Db 901 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 960 

Qy 1065 TACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCC 1124 

I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I 
Db 961 NNNNNNNNNNNNNNNNNNNNNNNGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCC 1020 

Qy 1125 TT CT CTCTCT TGGACATTGAACGTGT CTT TAAGGGGAAAT ACAAAGAGTT GAACAAAGAA 1184 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 TT CT CT CT CTTGGACATT GAACGT GT CTTTAAGGGGAAAT ACAAAGAGT T GAACAAAGAA 1080 

Qy 1185 ACTT CACGCT GGACT ACTT ATAGGGGCC CT GAGAC CAAC C C CC GGC C AGG C AGTT GCT CA 1244 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 ACTTCACGCT GGACT ACTT AT AGGGGCCCT GAGAC CAAC C C CCGGC C AGGCAGTT GCT CA 1140 

Qy 1245 GT GGGCCC CT CCT CT GATAAGGCCCT GACCTT C AT GAAGGACCATT T C CT GAT GGAT GAG 1304 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 GT GGGCC C CT CCT CTGATAAGGCCCT GACCTT CAT GAAGGACCATT T C CT GAT GGAT GAG 1200 

Qy 1305 CAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTG 1364 

I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 CAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTG 1260 

Qy 1365 GAGACAGC CC AGGGCCT TGAT GGGCACAGCCAT CT T GTC AT GT AC CT GGGAACCACCACA 1424 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 GAGACAGCC CAGGGCCTT GAT GGGCAC AGC CAT CT T GT CAT GT AC CT GGGAACCACCACA 1320 

Qy 1425 GGGTCGCTCCACAAGGCTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATT 1484 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1321 GGGTCGCT CCACAAGGCT GT GGTAAGTGGGGAC AGC AGT GCT CAT CT GGT GGAAGAGATT 138 0 

Qy 1485 CAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCA 1544 

I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCA 144 0 

Qy 1545 GTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTAT 1604 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I 
Db 1441 GT GTTT GTAGGCTT CT CAGGAGGT GT CT GGAGGGT GC C C C GAGC CAACT GT AGT GT CT AT 1500 

Qy 1605 GAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCC 1664 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1501 GAGAGCT GT GTGGACTGT GTC CTT GCCCGGGAC C C CCACT GT GC CT GGGAC C CT GAGT CC 1560 

Qy 1665 CGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGG 1724 



1561 CGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGG 1620 



Qy 1725 GGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGC 1784 

I I I I II I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 GGGAACCCAGAGTGGGCAT GT GC CAGT GGC C C C ATGAGCAGGAGCCTT CGGC CT C AGAGC 168 0 

Qy 1785 CGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGC 1844 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1681 CGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGC 1740 

Qy 1845 CC C CACCT GT CAGCCTT GGC CTCTTAT T ATT GGAGT CAT GGCC C AGCAGC AGT C CCAGAA 1904 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 CCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAA 18 00 

Qy 1905 GCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGT 1964 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 GCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGT 1860 

Qy 1965 CTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTG 2024 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1861 CTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTG 192 0 

Qy 2 025 GACAGCCAGGACCAGACCCT GGC C CT GGAT CCT GAACT GGCAGGC AT C CC CC GGGAGCAT 2 084 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 GACAGCCAGGACCAGACCCT GGC CCT GGAT C CT GAACT GGC AGGC AT C CC C C GGGAGCAT 198 0 

Qy 2085 GT GAAGGT CC C GTT GAC CAGGGT CAGT GGT GGGGCC GC C CT GGCT GC C CAGCAGT C CT AC 2144 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1981 GTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTAC 2040 

Qy 214 5 TGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATC 2204 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 T GGC C CCACTTTGTCACTGTCACTGT CCT CTTTGCCTTAGTGCTTTCAGGAGCCCT CATC 2100 

Qy 2205 ATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAG 2264 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 ATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAG 2160 

Qy 2265 ACCCTGCGCCCT 2276 

I I I I I I I I I I I I 
Db 2161 ACCCTGCGCCCT 2172 



RESULT 4 
AY4 02622 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 



AY4 02622 



2133 bp 



DNA 



linear GSS 12-DEC-2003 



Pan troglodytes HCM1285 gene, 
genomic survey sequence. 
AY402622 

AY402622 .1 GI : 39758608 
GSS. 

Pan troglodytes (chimpanzee) 
Pan troglodytes 
Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 2133) 



VIRTUAL TRANSCRIPT, partial sequence, 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Pan. 



AUTHORS Clark,A.G., Glanowski, S . , Nielson,R., Thomas,?., Kejariwal, A. , 
Todd, M. A. , Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams , M . D . and Cargill,M. 

TITLE Inferring nonneutral evolution from human- chimp-mouse orthologous 

gene trios 

JOURNAL Science 302 (5652), 1960-1963 (2003) 
PUBMED 14671302 
REFERENCE 2 (bases 1 to 2133) 

AUTHORS Clark, A. G. , Glanowski, S . , Nielson,R., Thomas, P., Ke j ariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T . J. , Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
TITLE Direct Submission 

JOURNAL Submitted ( 16-NOV-2003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 
COMMENT This sequence was made by sequencing genomic exons and ordering 

them based on alignment. 
FEATURES Location/Qualifiers 
source 1. .2133 

/organism= M Pan troglodytes" 
/mol_type=" genomic DNA" 
/db_xref="taxon:9598" 
gene <1 . . >2133 

/locus_tag="HCM1285" 

ORIGIN 



Query Match 56.2%; 
Best Local Similarity 82.9%; 
Matches 1769; Conservative 



Score 1765.4; 
Pred. No. 0; 
0; Mismatches 



DB 9; Length 2133; 



364; Indels 



0; Gaps 



0; 



Qy 

Db 



105 ATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAA 164 
I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1 ATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAA 60 



Qy 

Db 



165 CTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCC 224 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

61 CTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGANNCGGGCAGGGGCCCATGCCC 120 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



225 AGGGT C AGAT ACT ATGCAGGGGAT GAACGT AGGGC ACTT AGCTT CTT CCAC CAGAAGGGC 284 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I 

121 AGGGTCAGATACTATGCAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGC 180 

285 CTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCT 344 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I 
181 CTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCT 240 

345 C GAGAAGC CATT CT GGCCTT GGAT ATC CAGGAT CCAGGGGT C C C CAGGCTAAAGAAC AT G 4 04 

I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 C GAGAAGCCATTCT GGCCTT GGAT ATCC AGGAT CCAGGGGTC CC CAGGCTAAAGAACAT G 300 

405 AT ACCGT GGC CAGCCAGT GACAGAAAAAAGAGT GAAT GT GCCTTTAAGAAGAAGAGCAAT 4 64 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 AT ACCGT GGCCAGC CAGT GACAGAAAAAAGAGT GAAT GT GCCTTTAAGAAGAAGAGCAAT 360 



Qy 



465 GAGACACAGT GTTT CAACTT CATC C GT GTCCT GGTTT CTT ACAATGTCACC C AT CT CT AC 524 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 



Db 361 GAGACACAGT GTTT CAACTT CAT C C GT GTC CT GGT TT CTT ACAAT GT CAC C CAT CT CT AC 420 

Qy 525 ACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTAC 584 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 421 ACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTAC 480 

Qy 585 CTGTTGCCCATCTCGGAGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCC 644 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 CTGTTGCCCATCTCGGAGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCC 540 

Qy 645 GCTC ACAAGCAT AC GGCT GT CTT GGT GGAT GGGAT GCT CT AT T CT GGT ACT AT GAACAAC 704 

I I I I II I II I I I I I I I I I I I I I I I I I I I 
Db 541 GCTCACAAGCATACGGCTGTCTTGGTGGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 600 

Qy 705 T T CCTGGGCAGT GAGCCCAT CCT GAT GC GCAC ACT GGGAT C C CAG CCT GT C CT CAAGAC C 764 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 NT CCT GGGCAGTGAGCC CAT CCT GATGCGC ACACT GGGAT C C CAGC CT GT C CT CAAGAC C 660 

Qy 765 GACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACC 824 

I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 GACAACTTCCTCCGCTGGCTGCATCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 720 

Qy 825 C AGGT CGTCTACTT CTT CTT CGAGGAGACAGC CAGCGAGT TTGACTT CTT T GAGAGGCTC 884 

Db 721 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 780 

Qy 885 CACACATCGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAG 944 

Db 781 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 840 

Qy 945 AAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCC 1004 

Db 841 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 900 

Qy 1005 TTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATC 1064 

Db 901 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 960 

Qy 1065 TACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCC 1124 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I 
Db 961 NNNNNNNNNNNNNNNNNNNNNNNGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCC 1020 

Qy 1125 TT CT CTCTCTTGGACAT T GAAC GT GTCTTTAAGGGGAAAT ACAAAGAGTT GAACAAAGAA 1184 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 TT CT CT CTCTT GGACAT TGAACGT GTCTTTAAGGGGAAAT ACAAAGAGTT GAACAAAGAA 1080 

Qy 1185 ACTT CAC GCTGGACTACTT ATAGGGGCC CT GAGAC CAACC C C C GGC CAGGC AGTT GCT CA 1244 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1081 ACTTCACGCTGGACTACTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCA 114 0 

Qy 1245 GTGGGCCCCTCCTCTGATAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATGGATGAG 1304 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 GTGGGCCCCTCCTCTGATAAGGCCTTGACCTTCATGAAGGACCATTTCCTGAT GGAT GAG 1200 



Qy 1305 CAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTG 1364 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 CAGGTGGTAGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTG 1260 



Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1365 



1261 



1425 



GAGACAGCCCAGGGC CTT GAT GGGCACAGCCAT CTT GT CAT GT AC CT GGGAAC CAC C AC A 1424 
I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I 1 
GAGACAGCCC AGGGCCTT GAT GGGCACAGC CAT CTT GTCAT GT AC CT GGGAAC CAC CAC A 1320 



GGGTCGCTC C ACAAGGCTGT G GTAAGTGGGGACAGC AGT GCT CAT CT GGT GGAAGAGAT T 1484 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1321 GGGTCGNTCCACAAGGCTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGANNNNNTT 1380 

1485 CAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCA 1544 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 CAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCA 1440 

1545 GTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTAT 1604 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 GTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTAT 1500 

1605 GAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCC 1664 

I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1501 GAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGATCCTGAGTCC 1560 

1665 CGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGG 1724 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1561 CGAACCTGTTGCCTCCTNNNNNNNNNNNNNNNGAACTCCTGGAAGCAGGACATGGAGCGG 1620 

1725 GGGAAC C CAGAGT GGGCAT GT GCCAGT GGCC CCATGAGCAGGAGC CTT C GG CCTCAGAGC 1784 

I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 GGGAAC CCAGAGTGGGCAT GT GCCAGT GGCC CCAT GAGCAGGAGCCT T C GGC CTCAGAGC 1680 

1785 CGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGC 1844 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I II I I I I 
1681 CGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCTAACTCCATCCTGGAGNTCCCCTGC 1740 

1845 C C CCAC CT GT C AGCCTT GGCCT CTT ATTATT GGAGT CAT GGC C CAGC AGC AGT CC C AGAA 1904 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 CC CCAC CT GT CAGCCTTGGCCTCTT ACT ATT GGAGT CAT GGC C CAGCAGCAGT CC CAGAA 1800 

1905 GCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGT 1964 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 GCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGT 1860 

1965 CTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTG 2024 

I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I II I II I I I I I I I I II I I I I I I I I I 
1861 CTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTG 1920 

2025 GACAGCCAGGAC CAGACCCTGGCC CTGGAT C CT GAACT GGC AGGCAT CCCCC GGGAGCAT 2084 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 GACAGCCAGGAC CAGACCCTGGCC CTGGAT CCT GAACT GGCAGGCAT CCCC C GGGAGCAT 1980 

2085 GTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTAC 2144 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I 
1981 GTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTAC 2040 

2145 TGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATC 2204 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I 
2041 TGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATC 2100 



Qy 

Db 



2205 AT CCT CGT GGC CTC C CCATT GAGAGCACT CCGG 2237 

I I I I I I I I I I I I I I I II I I I I I I I I I II I I 
2101 ATCCTCNTGGCCTCCCCANNGAGAGCACTCCGG 2133 
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AK077976 3206 bp mRNA linear HTC 03-APR-2004 
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enriched library, clone : 60304 92A12 product :sema domain, 
immunoglobulin domain (Ig), transmembrane domain (TM) and short 
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AK077976 

AK077976. 1 GI : 26097602 
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1. .3206 

/organism="Mus musculus" 

/mol_type="mRNA" 

/strain="C57BL/6J" 

/db_xref="FANTOM_DB: 6030492A12" 

/ db_xr e f = " t axon : 1 0 0 9 0 " 

/clone="6030492A12" 

/sex="male" 

/ tissue_type="testis" 

/clone_lib="RIKEN full-length enriched mouse cDNA library" 
/dev_stage="13 days embryo" 
224. .2507 
/not e= "putative 

sema domain, immunoglobulin domain (Ig), transmembrane 
domain (TM) and short cytoplasmic domain, (semaphorin) 4A 
(MGDIMGI: 107560, GB | NM_013658, evidence: BLASTN, 99%, 
match=2517) " 
3181. .3186 
/note="putative" 
3206 

/note="putative" 



ORIGIN 



Query Match 55.6%; Score 1747.4; DB 3; Length 3206; 

Best Local Similarity 76.7%; Pred. No. 0; 

Matches 2355; Conservative 0; Mismatches 621; Indels 95; Gaps 



14; 



Qy 

Db 



75 GAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCCTGGGCCTGGACCCC 134 

III I I I I I I I I 1 I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
194 GAAC CAT CT GGT GAC C ATCT CAGGCT GAC CAT GGC C CT AC CAT CC CT GGGC CAGGACT CA 253 



Qy 135 TGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGCTGCCGACGACGACC 194 

II I I I I I I I I I I I I I I I I I I I I I I I I I I II II I III I I 

Db 254 TGGAGTCTCCTGCGTGTTTTTTTCTTCCAACTCTTCCTGCTGCCATCACTGCCACCTGCT 313 

Qy 195 GCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATGCAGGGGATGAACGT 254 

I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 314 T CT GGGACT GGT GGT CAGGGGCCCATGC C CAGAGT C AAATAC C AT GCT GGAGAC GGGC AC 373 

Qy 255 AGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACACTCTGCTCCTGAGT 314 

I I I I I II I I I I I I I I I I I II II I I I I II I II I I I I I I I I I II I I I I I I I I I 

Db 374 AGGGCCCTCAGCTTCTTCCAACAAAAAGGCCTCCGAGACTTTGACACGCTGCTCCTGAGT 433 

Qy 315 GGT GATGGAAAT ACT CT CT AC GT GGGGGCT C GAGAAGC CAT T CT GGC CTT GGATAT C CAG 374 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 434 GACGATGGCAACACTCTCTATGTGGGGGCTCGAGAGGCCGTCCTGGCCTTGAATATCCAG 493 

Qy 375 GAT CCAGGGGT C C CCAGGCTAAAGAACAT GAT ACC GT GGC C AGCCAGT GACAGAAAAAAG 434 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 494 AACCC AGGAAT C C CAAGGCTAAAGAACATGAT ACCCT GGC C AGC CAGT GAGAGAAAAAAG 553 

Qy 435 AGT GAAT GT GC CT TTAAGAAGAAGAGCAAT GAGACAC AGT GTTT CAACTT CAT C CGT GT C 4 94 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 
Db 554 ACC GAAT GTGCCT TTAAGAAGAAGAGCAAT GAGACAC AGT GTTT CAACTT CATTCGAGTC 613 

Qy 495 CTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCT 554 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 614 CTGGTCTCTTACAATGCTACTCACCTCTATGCCTGTGGGACCTTTGCCTTCAGCCCTGCC 673 

Qy 555 TGTACCTTCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGGAGGACAAGGTCATG 614 

I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 674 T GT AC CTT CATT GAACT C CAAGATT CC CT C CT GTTGC CCAT CTT GAT AGACAAGGT C ATG 733 

Qy 615 GAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGTGGAT 674 

II II II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I III 

Db 734 GAC GGGAAGGGCCAAAGC C C CTTT GAC CCT GTT C ACAAGCACACAGCT GT CTT GGT C GAT 793 

Qy 675 GGGAT GCTCTATT CT GGT ACT AT GAACAACTT C CTGGGCAGT GAG C CCAT C CT GAT G C GC 734 

I I I I I I I I I I I I I II II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 794 GGGAT GCTTTATT CCGGCAC CAT GAACAACTT C CT GGGCAGCGAGC CCAT CCT GAT GC GG 853 

Qy 735 ACACTGGGAT CC CAGC CT GT CCT CAAGACC GACAACT TCCTCCGCT GGCT GC AT CAT GAC 794 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 854 ACACTGGGATCCCAGC CTGTT CT CAAGACT GACAT CT T CT T ACGCT GGCT GC AC GC GGAT 913 

Qy 795 GCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGAGGAGACA 854 

MINIM I I I I II I I I I I II II I I II I I I I I I I I I I I I I I I I M I I I I II II I 

Db 914 GCCTCCTTCGTGGCAGCCATTCCATCCACCCAGGTCGTCTATTTCTTCTTTGAGGAGACA 973 

Qy 855 GCCAGCGAGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGGCTAGAGTCTGCAAG 914 

I I I I I I I I I I I I I I I I I I I I II I III I I III I I I I I I I I I I I I I I I I I I 

Db 974 GCCAGCGAGTTT GACTT CTTTGAAGAGCTGT AT AT AT C CAGGGT GGCT CAAGT CTGCAAG 1033 

Qy 915 AAT GACGT GGGCGGCGAAAAGCTGCT GCAGAAGAAGT GGACCAC CTTC CT GAAGGCC CAG 974 



II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 

Db 1034 AACGACGTGGGCGGTGAAAAGCTGCTGCAGAAGAAGTGGACCACCTTCCTCAAAGCCCAG 1093 

Qy 975 CTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCTC 1034 

I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1094 TTGCTCTGCGCTCAGCCAGGGCAGCTGCCATTCAACATCATCCGCCACGCGGTCCTGCTG 1153 

Qy 1035 CCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCCCAGTGGCAGGTT 1094 

I I I I I II I I I I I I I I I I I III I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1154 CCCGCCGATTCTCCCTCTGTTTCCCGCATCTACGCAGTCTTTACCTCCCAGTGGCAGGTT 1213 

Qy 1095 GGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTTT 1154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1214 GGCGGGACCAGGAGCTCAGCAGTCTGTGCCTTCTCTCTCACGGACATTGAGCGAGTCTTT 1273 

Qy 1155 AAGGGGAAATACAAAGAGTTGAACAAAGAAACTTCACGCTGGACTACTTATAGGGGCCCT 1214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1274 AAAGGGAAGT ACAAGGAGCT GAACAAGGAGACCT C C CGCTGGACC ACTT AC C GGGGCTC A 1333 

Qy 1215 GAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGATAAGGCCCTGACC 1274 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1334 GAGGTC AGCCCGAGGCAAGGCAGTT GCT C CAT GGGCC C CT C CT CT GACAAAGC CT T GAC C 1393 

Qy 1275 TT CATGAAGGACCATTT C CT GAT GGAT GAGCAAGT GGT GGGGACGC CC CT GCT GGT GAAA 1334 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I 
Db 1394 TTCATGAAGGACCATTTT CTGATGGATGAGCACGT GGTAGGAACACCCCT GCTGGTGAAG 1453 

Qy 1335 T CT GGC GTGGAGTATACACGGCTT GCAGT GGAGAC AGCC C AGGGC CTT GAT GGGC ACAGC 1394 

I I II I I I I I I I II I I II I I I I II I I I I I I I I II I I II I II I II II I II I I I I 

Db 1454 TCTGGTGTGGAGTACACACGGCTTGCTGTGGAGTCAGCTCGGGGCCTTGATGGGAGCAGC 1513 

Qy 1395 CAT CTT GT CAT GTAC CT GGGAACCACC ACAGGGT C G CT C CACAAGGCT GT GGT AAGT GGG 1454 

III I I I I I I I I I I I I I I III II I I II I II II I I I I I I I II I I I II I I 
Db 1514 CAT GTGGT CAT GTAT CT GGGT AC CT CC AC GGGGT C C CT G CACAAGGCT GT GGT GC CT CAG 1573 

Qy 1455 GACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTG-TTCCCTGACCCTGAACCTGTTCG 1513 

I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 1574 GACAGCAGT GCTTAT CT C GT GGAGGAGAT T C AGCT GAGCC C CT GACT CT GAGCCT GT T CG 1633 

Qy 1514 CAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCTCAGGAGGTGTCTG 1573 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I Mill I I I I 
Db 1634 AAACCTGCAGCTGGCCCCCGCCCAGGGTGCAGTGTTTGCAGGCTTCTCTGGAGGCATCTG 1693 

Qy 1574 GAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCG 1633 

III II III I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I II I I I I II I I 
Db 1694 GAGAGTT CCCAGGGCCAATT GCAGT GT CT AC GAGAGCT GT GT GGACTGT GT GCTT GCCAG 1753 

Qy 1634 GGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAA 1693 

II I I I I I I I I I I I I I I I I I I I I I I I I II II III I I I I I I I I I I I I I I 

Db 1754 GGACCCTCACTGTGCCTGGGACCCTGAATCAAGACTCTGCAGCCTTCTGTCTGGCTCTAC 1813 

Qy 1694 C CT GAACT CCTGGAAGCAGGACAT GGAG C GGGGGAACCCAGAGT GGGCATGT GCCAGTGG 1753 

I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1814 C AAGCCTT GGAAGC AGGACAT GGAAC GCGGCAACC CGGAGT GGGT ATGCACC C GTGG 1870 

Qy 1754 CCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTAAAGAAGTCCTGGC 1813 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 



Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



1871 CCCCATGGCCAGGAGCCCCCGGCGTCAGAGCCCCCCTCAACTAATTAAAGAAGTCCTGAC 1930 

1814 TGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTA 1873 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I 

1931 AGTCCCCAACTCCATCCTGGAGCTGCCCTGCCCCCACCTGTCAGCACTGGCCTCTTACCA 1990 

1874 T T G GAGT CAT GGC C CAGCAGCAGT C CCAGAAGC CT CT T C C ACT GT CT ACAAT GGCT C C CT 1933 

II I I I I I I I I I I I III I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
1991 CTGGAGT CAT GGCC GAGCCAAAAT CTCAGAAGC CT CT GCTACC GT CT ACAAT GGCT CCCT 2050 

1934 CTT GCTGATAGT GCAGGAT GGAGTT GGGGGT CT CTACC AGT GCT GGGCAACT GAGAATGG 1993 

I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I I III I I I I I I I I II 
2051 CTTGCTGCTGCCGCAGGATGGTGTCGGAGGCCTCTACCAGTGTGTGGCGACTGAGAAC GG 2110 

1994 CTTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCCAGGACCAGACCCTGGCCCTGGA 2053 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2111 CTACTCATACCCTGTGGTCTCCTATTGGGTAGACAGCCAGGACCAGCCCCTGGCGCTGGA 2170 

2054 T CCT GAACT GGCAGGCATC CCCCGGGAGCAT GT GAAGGT CC C GT T GAC CAGGGT CAGT GG 2113 

I I I I I I I I I I III I I I I I I I I I I MM II II I I II I I I I I II II II I II 
2171 CCCTGAGCTGGCGGGCGTTCCCCGTGAGCGTGTGCAGGT CCCGCTGAC CAGGGT CGGAGG 2230 

2114 TGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCACTGTCACTGTCCT 2173 

II II II I I I I I I I II I I I I I II II I II I I II II III III II II II I I I 
2231 CGGAGCTTCCATGGCTGCCCAGCGGTCCTACTGGCCCCATTTTCTCATCGTTACCGTCCT 2290 

2174 CTTT GCCTTAGT GCTTTCAGGAGCCCT CAT CAT CCT CGT GGC CT CCC CAT T GAGAGCACT 2233 

I I I I I I I I I I I MM I II I II I I I I I I I I I I I I II I II I I 

2291 CCTGGCCATCGTGCTCCTGGGAGTGCTCACTCTCCTCCTCGCTTCCCCACTGGGGGCGCT 2350 

2234 CCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTT 2293 

II I I I II I II I I I I II I I I II I I I II I II MM III I II I II II I II I 

2351 GCGGGCTCGGGGTAAGGTTCAGGGCTGTGGGATGCTGCCCCCCAGGGAAAAGGCTCCACT 2410 



2294 



2353 



AAGCAGAGAGCAACAC CT C CAGTCT CCCAAGGAAT GCAGGACCT CTGC CAGT GAT GT G GA 

I I I I I I I I I II I I I I I II I I I I II I I I II II I I I I II I II I I II I I I I 
2411 GAGCAGGGACCAGCACCTC CAGC C CTC CAAGGAC C ACAG GACCT CT GCCAGTGAC GT AGA 2470 

2354 CGCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCT- 2412 

II I I II I I II I I I I I I I I I II I II I II I I III III 
2471 T GC C GACAACAACCATCT GGGC GCC GAAGT GGCTT AAACAGGGACACAGAT CC GCAGCT G 



2530 



2413 - GCGGTGCAGGCACCTGGCCATGCT GGCT GGGCGGCCCAAGCACAGCCCT GACTAGGAT G 2471 

II I II I I I II I II I I I I I I I I II 

2531 AGCAGAGCAAGCCACTGGCCTTGTTGGCTATGC 2563 



2472 



2564 



2532 



2620 



2592 



2663 



AC AGCAGCACAAAAGACC ACCTTT CT CC CCT GAGAGGAGCTT CT GCT ACT CT GC AT C ACT 2531 

III I II II I I I II I II II I II I II I I II 
CAGGCACAGT GC CACTCT GAC CAGGGT AGGAGGCT CT CCT GCTAAC GT GT GT CAC C 2619 

GAT GACACT CAGCAGGGTGAT GCACAGCAGT CT GC CT C C CCT AT GGGACT C C CTT CT AC C 2591 

I I M I II I I I II II I I I I II I I I I I I I II I I I 

TACAGCACCCAGTAGG TCCTCCCCTGTGGGACTCTCTTCTGCA 2 662 

AAGCACAT GAGCT CT CTAACAGGGTGGGGGCT ACCC CC AGAC CT GCT CCT ACACT GAT AT 2651 
I I I I I I I II I II I I I I I I I I I I I 

AGC ACATTGGGCT GT CT CCAT ACCT GTACTT GT GCT GT GAC 27 03 



Qy 

Db 



2652 T GAAGAACCT GGAGAGGAT C CTT CAGTT CT GGC CATT C C AGGGAC CCT C C AGAAACACAG 2711 

II II I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

2704 AGGAAGAGC CAGAC AGGTTT CTTT GATTT T GAT T GAC C CAAGAGC CCT C CT GTAACAAAC 2763 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2712 T GTTTCAAGAGACCCTAAAAAAC CT GCCT GT CC CAGGAC C CT AT G GT AAT GAACAC CAAA 2771 

I I I I II III I III II I II I I I I I I I I 

2764 GTGCT C CAGGAGACCATGAAAGGT GTGGCT GTCT GGGATT CT GT G GT GACAAAC - CT AAG 2822 

2772 CATCTAAACAATCATATGCTA ACATGCCACTCCTGGAAACTCCACTCT G 2820 

II I I I I I I I I I I I I I I I I I I I II I I I 

2823 CATCCGAGCAAGCT GGGGCT ATT CCTGCAAACT C CAT C CT GAAC GCT GT CACT CT AGAAG 2882 

2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTC-TCCCAGGGTCATGCAGGGATCTGCTCC 2879 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M 

2883 CAGCTGCTGCTTTGAACACCAGCCCACCCTCCTTCCCAAGAGTCTCTATGGAGTTGGCCC 2942 

2880 CTCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTG 2939 

II I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I 

2943 CTTGTGTTTCCTTTACCAGTCATGCCATACTGTTT GGGAAGT CAT CT CT GAAGT CT A 2999 

2940 ACCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCT TCTGCCCTGGC-AG 2995 

I I I I I I I I I I I I I I I I I I I I I II II MM I I II I I II II I I I I II II 
3000 ACCACCTTCCTTCTTGCTTCAGTTTGGACAGATTGTTATTATTGTCTCTGCCCTGGCTAG 3059 

2996 AATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCT 3055 

I I I I I II I I II I I II I I I II I I I I I I I I I M I I I II I I I 
3060 AATGGGGGGCATAATCTGAGCCTTGTTCCCTTGTCCAGTGTGGCTGACCCTTGACCTCTT 3119 

3056 CCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTT 3115 

M I I I I II I I II I M I II M I I II I M M I II I II I I I I I I II I I I II II 
3120 — CCTTCCTCCTCCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCACAGACAATTTATTT 3177 

3116 TTTATTAAAAA 3126 

I I I I I I I II I I 
3178 TTTATTAAAAA 3188 



RESULT 6 
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LOCUS 

DEFINITION 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
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JOURNAL 
MEDLINE 



AK035918 3086 bp mRNA linear HTC 03-APR-2004 

Mus musculus 16 days neonate cerebellum cDNA, RIKEN full-length 
enriched library, clone : 9630018D15 product : sema domain, 
immunoglobulin domain (Ig) , transmembrane domain (TM) and short 
cytoplasmic domain, (semaphorin) 4A, full insert sequence. 
AK035918 

AK035918.1 GI: 26084904 
HTC; CAP trapper. 
Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 
1 

Carninci,P. and Hayashizaki, Y. 
High-efficiency full-length cDNA cloning 
Meth. Enzymol. 303, 19-44 (1999) 
99279253 



PUBMED 10349636 
REFERENCE 2 

AUTHORS Carninci,P., Shibata,Y., Hayatsu,N., Sugahara,Y., Shibata,K., 

Itoh,M., Konno,H., Okazaki,Y., Muramatsu,M. and Hayashizaki , Y . 
TITLE Normalization and subtraction of cap-trapper-selected cDNAs to 

prepare full-length cDNA libraries for rapid discovery of new gene 
JOURNAL Genome Res. 10 (10), 1617-1630 (2000) 
MEDLINE 20499374 
PUBMED 11042159 
REFERENCE 3 

AUTHORS Shibata,K., Itoh,M. , Aizawa,K., Nagaoka,S., Sasaki, N., Carninci,P. 

Konno,H., Akiyama,J., Nishi,K., Kitsunai,T., Tashiro,H., Itoh,M., 
Sumi,N., Ishii,Y., Nakamura,S., Hazama,M., Nishine,T., Harada,A. , 
Yamamoto,R., Matsumoto, H . , Sakaguchi, S . , Ikegami,T., Kashiwagi, K. , 
Fujiwake,S., Inoue,K w Togawa,Y., Izawa,M., Ohara,E., Watahiki,M., 
Yoneda,Y., Ishikawa,T., Ozawa,K., Tanaka,T., Matsuura,S., Kawai,J. 
Okazaki f Y., Muramatsu,M. , Inoue,Y., Kira,A. and Hayashizaki, Y. 

TITLE RIKEN integrated sequence analysis (RISA) system — 384-format 

sequencing pipeline with 384 multicapillary sequencer 

JOURNAL Genome Res. 10 (11), 1757-1771 (2000) 

MEDLINE 20530913 
PUBMED 11076861 
REFERENCE 4 

AUTHORS The RIKEN Genome Exploration Research Group Phase II Team and the 

FANTOM Consortium. 
TITLE Functional annotation of a full-length mouse cDNA collection 

JOURNAL Nature 409, 685-690 (2001) 
REFERENCE 5 

AUTHORS The FANTOM Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

TITLE Analysis of the mouse transcriptome based on functional annotation 

of 60,770 full-length cDNAs 

JOURNAL Nature 420, 563-573 (2002) 
REFERENCE 6 (bases 1 to 3086) 

AUTHORS Adachi,J., Aizawa,K., Akimura,T., Arakawa,T., Bono,H., Carninci,P. 
Fukuda,S., Furuno,M., Hanagaki,T., Hara,A., Hashizume, W. , 
Hayashida, K. , Hayatsu,N., Hiramoto,K., Hiraoka,T., Hirozane,T., 
Hori,F., Imotani,K., Ishii,Y., Itoh,M. , Kagawa,I., Kasukawa,T., 
Katoh,H., Kawai,J., Kojima,Y., Kondo,S., Konno,H., Kouda,M., 
Koya,S., Kurihara,C, Matsuyama, T . , Miyazaki,A., Murata,M., 
Nakamura,M., Nishi,K., Nomura, K., Numazaki,R., Ohno,M., Ohsato,N., 
Okazaki,Y., Saito,R., Saitoh, H. f Sakai,C, Sakai,K., Sakazume,N., 
Sano,H., Sasaki, D., Shibata,K., Shinagawa, A. , Shiraki,T., 
Sogabe,Y., Tagami,M., Tagawa,A., Takahashi, F. , Takaku-Akahira, S . , 
Takeda,Y., Tanaka,T., Tomaru,A. , Toya,T., Yasunishi, A. , 
Muramatsu,M. and Hayashizaki, Y. 

TITLE Direct Submission 

JOURNAL Submitted ( 16- JUL-2001) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN), Laboratory for Genome 
Exploration Research Group, RIKEN Genomic Sciences Center (GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama 
Kanagawa 230-0045, Japan (E-mail : genome-res@gsc . riken . jp, 
URL:http: //genome. gsc.riken.jp/, Tel : 81-45-503-9222, 
Fax:81-45-503-9216) 
COMMENT cDNA library was prepared and sequenced in Mouse Genome 

Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 



Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues. 

Please visit our web site for further details. 
URLrhttp: //genome . gsc. riken . jp/ 
URL: http: //f antom. gsc. riken. jp/ . 
FEATURES Location/Qualifiers 
source 1. .3086 

/organism="Mus musculus" 

/mol_type="mRNA" 

/strain="C57BL/6J" 

/db_xref="FANTOM_DB:9630018D15" 

/db_xref="taxon: 10090" 

/clone="9630018D15" 

/tissue_type="cerebellum" 

/clone_lib="RIKEN full-length enriched mouse cDNA library" 
/dev_stage="16 days neonate" 
misc_feature 59. .2388 

/note="putative 

sema domain, immunoglobulin domain (Ig), transmembrane 
domain (TM) and short cytoplasmic domain , (semaphorin) 4 A 
(MGDIMGI: 107560, GB | NM_013658 , evidence: BLASTN, 99%, 
match=2517)" 

polyA_signal 3062. .3067 

/note="putative " 

polyA_site 3086 

/note="putative " 

ORIGIN 

Query Match 54.1%; Score 1701.4; DB 3; Length 3086; 

Best Local Similarity 75.2%; Pred. No. 0; 

Matches 2364; Conservative 0; Mismatches 637; Indels 141; Gaps 14; 

Qy 50 AACGCAGC GGC AT CCC CAGGCT CC AGAGCT CC CT GGT GAC AGT CT GT GGCT GAGCAT GGC 109 

I I I I I I II I I I I I I I I I I I I I I III MINIMUM 

Db 4 AACCCAGAAAGT GCCT GTTTCCT C AGAACCAT CT GGT GAC CAT CTCAGGCT GAC CAT GGC 63 

Qy 110 CCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCT 169 

I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

Db 64 CCTACCATCCCTGGGCCAGGACTCATGGAGTCTCCTGCGTGTTTTTTTCTTCCAACTCTT 123 

Qy 170 TCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGT 229 

I I I I I I III I I Mil I I I I M I I I I I I I II I I I I I I I I 

Db 124 CCTGCTGCCATCACTGCCACCTGCTTCTGGGACTGGTGGTCAGGGGCCCATGCCCAGAGT 183 

Qy 230 CAGAT ACT AT GCAGGGGAT GAACGT AGGGCACT T AGCTT CTT C CACCAGAAGGGCCT CCA 289 

I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 184 CAAATAC CATGCT GGAGAC GGGCACAGGGC CCT CAGCTT CTT CCAAC AAAAAGGCCT CC G 243 

Qy 290 GGATTTT GACACTCT GCTCCTGAGT GGT GAT GGAAAT ACT CT CT ACGT GGGGGCTC GAGA 349 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 244 AGACTTTGACACGCT GCT C CTGAGT GAC GAT GGCAAC ACT CT CT AT GT GGGGGCTC GAGA 303 

Qy 350 AGC CATTCTGGCCTT GGATATC CAGGAT CCAGGGGT CCC CAGGCT AAAGAACAT GAT AC C 409 

I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 304 GGC C GTC CT GGCCTT GAAT AT CCAGAACCC AGGAAT C C CAAGGCTAAAGAACAT GAT AC C 363 



Qy 



410 GT GGC CAGCCAGTGACAGAAAAAAGAGT GAAT GT GC CTTTAAGAAGAAGAGCAAT GAGAC 4 69 



I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 364 CT GGC C AGCCAGT GAGAGAAAAAAGACCGAAT GT GC CTTTAAGAAGAAGAGCAAT GAGAC 423 

Qy 470 ACAGTGTTTCAACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTG 529 

I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I II II II I I I II I I I I 
Db 424 ACAGTGTTTCAACTTCATTCGAGTCCTGGTCTCTTACAATGCTACTCACCTCTATGCCTG 483 

Qy 530 CGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATT 566 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 484 TGGGACCTTTGCCTTCAGCCCTGCCTGTACCTTCATTACGTGCGACCCTGGCATTCTGGG 543 

Qy 567 GAACTT CAAGATT C CT ACCT GTT GC C CAT CT CGGAG 602 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 544 CTCCCAGCCTCTTCCCCCCTCTAGGAACTCCAAGATTCCCTCCTGTTGCCCATCTTGATA 603 

Qy 603 GACAAGGT CAT GGAGGGAAAAGGC CAAAGCCC CTTT GACC CC GCT CACAAG CAT ACGGCT 662 

I. II I I I I I I I I I I I II II I I I I I I I I II I II I I I I I I I I I I I I I I I I I II III 
Db 604 GACAAGGT CAT GGACGGGAAGGGC CAAAGCC CCTT T GACC CT GTTCACAAGCACACAGCT 663 

Qy 663 GTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGCCC 722 

I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I II I I I I I I I I I I I I II 
Db 664 GTCTTGGTCGATGGGATGCTTTATTCCGGCACCATGAACAACTTCCTGGGCAGCGAGCCC 723 

Qy 723 AT CCT GAT GCGCACACT GGGAT CCCAGCCT GT CCT CAAGAC C GACAACTT C CT C C GCT GG 7 82 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I II I 
Db 724 AT CCT GAT GCGGACACTGGGAT CCCAGCCT GT T CT CAAGACT GACAT CT T CT T AC GCT GG 783 

Qy 783 CTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTC 842 

I I I I I II I I I I I I I I II I I I II I I I I II II I I I II I I I I I I I I I I I I I I I 

Db 784 CTGCACGCGGATGCCTCCTTCGTGGCAGCCATTCCATCCACCCAGGTCGTCTATTTCTTC 843 

Qy 843 TT C GAGGAGACAGCCAGCGAGTTT GACTT CTTT GAGAGGCT C CACACAT C GCGGGT GGCT 902 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I 

Db 84 4 TTT GAGGAGACAGC CAGCGAGTTT GACTT CTTT GAAGAGCT GT AT AT AT C C AGGGTGGCT 903 

Qy 903 AGAGT CT GCAAGAATGACGTGGGCGGCGAAAAGCT GCT GCAGAAGAAGT G GAC C ACCTT C 962 

I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 904 CAAGTCT GCAAGAACGACGTGGGCGGTGAAAAGCT GCT GCAGAAGAAGTGGACCACCTTC 963 

Qy 963 CTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCAC 1022 

II II I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 964 CTCAAAGCCCAGTTGCTCTGCGCTCAGCCAGGGCAGCTGCCATTCAACATCATCCGCCAC 1023 

Qy 1023 GCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCC 1082 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III II I I I I I I I I I I I I I I I I I I I 

Db 1024 GCGGTCCTGCTGCCCGCCGATTCTCCCTCTGTTTCCCGCATCTACGCAGTCTTTACCTCC 1083 

Qy 1083 CAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATT 1142 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1084 CAGTGGCAGGTTGGCGGGACCAGGAGCTCAGCAGTCTGTGCCTTCTCTCTCACGGACATT 1143 

Qy 1143 GAACGTGT CTTTAAGGGGAAATACAAAGAGTT GAACAAAGAAACTT CACGCT GGACT ACT 1202 

II II I I I I I I I I I I I I I I I I I I III I I I I I I I II II II II I I I I I I III 

Db 1144 GAGC GAGT CTTTAAAGGGAAGTACAAGGAGCT GAACAAGGAGAC CTC CCGCT GGACC ACT 1203 

Qy 1203 TATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGAT 1262 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1204 TACCGGGGCTCAGAGGTCAGCCCGAGGCCAGGCAGTTGCTCCATGGGCCCCTCCTCTGAC 1263 

1263 AAGGCC CT GACCTT CAT GAAGGAC CATTT C CT GAT GGAT GAGCAAGTG GT GGGGAC GC C C 1322 

II III I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I II II III 

1264 AAAGCCT T GAC CTT C AT GAAGGAC CATT TT CT GAT GGAT GAGCAC GTGGT AGGAAC AC C C 1323 

1323 CTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCCTT 1382 

I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

1324 CTGCTGGTGAAGTCTGGTGTGGAGTACACACGGCTTGCTGTGGAGTCAGCTCGGGGCCTT 1383 

1383 GATGGGCACAGCCATCTTGTCATGTACCT GGGAACCACCACAGGGT CGCT CCACAAGGCT 1442 

I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I II I II I I I I I I 

1384 GATGGGAGCAGCCATGTGGTCATGTATCTGGGTACCTCCACGGGGTCCCTGCACAAGGCT 1443 

1443 GT GGTAAGT GGGGACAGCAGT GCT CAT CT GGT GGAAGAGAT T CAGCTGTT CCCT GAC C CT 1502 

I I I I I I I I I I I N I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I II II 

1444 GTGGTGC CT C AGGAC AGC AGT GCTTAT CT CGT GGAG GAGAT T C AGCTGAGC C CT GACT CT 1503 

1503 GAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCTCA 1562 

II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

1504 GAGCCTGTTCGAAACCTGCAGCTGGCCCCCGCCCAGGGTGCAGTGTTTGCAGGCTTCTCT 1563 

1563 GGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACTGT 1622 

I I I I I I I I I I I I II III I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

1564 GGAGGCATCTGGAGAGT T CC CAGGGCCAAT T GCAGT GT CT AC GAGAGCT GT GT GGACT GT 1623 



1623 GTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCTG 1682 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II III I I I I III 

1624 GTGCTGCNCAGGGACCCTCACTGTGCCTGGGACCCTGAATCAAGACTCTGCAGCCTTCTG 1683 

1683 TCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGGCA 1742 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1684 TCTGGCTCTACC AAGCCTT GGAAGCAGGAC AT GGAACGC GGCAACC C GGAGT GGGT A 1740 

1743 T GT GCCAGT GGCCCCAT GAGCAGGAGC CTTCGGCCT CAGAGC C GC C CGCAAAT CAT T AAA 1802 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III III I I II I I I 
1741 TGCACCCGTGGCCCCATGGCCAGGAGCCCCCGGCGTCAGAGCCCCCCTCAACTAATTAAA 1800 

18 03 GAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCTTG 1862 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1801 GAAGTCCTGACAGTCCCCAACTCCATCCTGGAGCTGCCCTGCCCCCACCTGTCAGCACTG 1860 

1863 GC CT CTT ATT ATT GGAGT CAT GGCC CAGC AGCAGT C CCAGAAGC CT CTT C C ACT GT CTAC 1922 

I I I I I I I I I I I I I I I I I I I II I III I II I I I I I I I I I I I I II I I I I I I 
1861 GCCT CTTACCACT GGAGT CATGGCCGAGC CAAAATCTCAGAAGCCT CT GCTACCGT CTAC 1920 

1923 AATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGGCA 1982 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I III 
1921 AATGGCTCCCTCTTGCTGCTGCCGCAGGATGGTGTCGGGGGCCTCTACCAGTGTGTGGCG 1980 

1983 ACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCCAGGACCAGACC 2042 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II 
1981 ACTGAGAACGGCTACT CATACCCT GTGGT CT C CT AT TGGGTAGACAGCC AGGAC CAGCCC 204 0 

2043 CTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGACC 2102 

I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2041 CTGGCGCTGGACCCTGAGCTGGCGGGCGTTCCCCGTGAGCGTGTGCAGGTCCCGCTGACC 2100 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2103 AGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCACT 2162 

I I I I I I I II II II II I I II I I I I I I I I II I I II I I I I I I I I I III III 
2101 AGGGTCGGAGGCGGAGCTTCCATGGCTGCCCAGCGGTCCTACTGGCCCCATTTTCTCATC 2160 

2163 GTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCCCA 2222 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2161 GTTACCGTCCTCCTGGCCATCGTGCTCCTGGGAGTGCTCACTCTCCTCCTCGCTTCCCCA 2220 

2223 TTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAG 2282 

II I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I III I I I I 
2221 CTGGGGGCGCTGCGGGCTCGGGGTAAGGTTCAGGGCTGTGGGATGCTGCCCCCCAGGGAA 2280 

2283 AAGGCC CCGTTAAGCAGAGAGCAACAC CT CCAGT CT CC CAAGGAAT GC AGGAC CT CT GC C 2342 

I I I I I II I I I I I I II II M I I I II II I I I I I I I I II I I I I I I I I I I I 
2281 AAGGCTCCACTGAGCAGGGACCAGCACCTCCAGCCCTCCAAGGACCACAGGACCTCTGCC 2340 

2343 AGT GAT GT GGACGCTGACAACAACT GC CTAGGCACT GAGGT AGCTTAAACT CT AGGCACA 24 02 

I I I I I II II II I I I I I I I I I II III I II II II I I I I I I 
2341 AGT GACGTAGAT GC CGACAACAACCAT CT GGGCGCC GAAGT GGCTTAAACAGGGACACAG 2400 

24 03 GGCCGGGGCT — GCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

III III I I I I I I I I I I I I I I I I I I I I I II 
2401 AT CCGCAGCT GAGCAGAGCAAGCCACT GGCCT T GTT GGCT AT GC 2444 

2461 T GACTAGGAT GACAGCAGCACAAAAGAC CACCTTT CT C C C CT GAGAGGAGCTT CT GCT AC 2520 

III I II II I I I I I I I I I I I I I I 

2445 CAGGCACAGT GC CACT CT GACC AGGGT AGGAGGCT CT C CT GCTAA 2489 

2521 T CT GCAT CACT GAT GACACT CAGCAGGGT GAT GCACAGCAGT CT GC CT CC C CT AT GGGAC 2580 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2490 CGTGTGTCACCTACAGCACCCAGTAGGT CCTCCCCTGTGGGAC 2532 

2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I I 

2533 TCTCTTCTGCAAGCACATTGGGCTGTCT CCAT AC CT GT ACT 2573 

2641 TACACT GAT ATT GAAGAACCT GGAGAGGATCCTTCAGTT CT GGC CATT C C AGGGAC C CT C 2700 

I III I II II I I I I I I I I I I I I I I I I I II I I I 

2574 T GT GCTGT GAC AGGAAGAGC CAGACAGGTTT CTTT GAT TT T GAT TGAC CCAAGAGCC CT C 2 633 

2701 C AGAAAC AC AGT GT TT CAAGAGACC CTAAAAAACCT GC CT GT C C CAGGAC C CT AT GGTAA 2760 
I I I II I I I I I I II III I III I I I I I I I 

CT GTAACAAACGTGCTC CAGGAGACCAT GAAAGGT GT GGCT GT CTGGGAT T CT GT GGT GA 2693 



2634 



2761 



2694 



T GAACACCAAACAT CTAAACAAT CAT AT GCT A ACATGCCACTCCTGGAAACTC 

I I I I I I I I I I I I I I I I I I I II III I 

CAAAC- CTAAGCAT CCGAGCAAGCT GGGGCT ATTC CT GCAAACT CC AT CCT GAACGCT GT 



2813 



2752 



2868 



2814 CACTCT GAAGCTGCCGCTTTGGACACCAAC ACT CCCTTC-TCC C AGGGT CAT GCAG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CACT CT AGAAGCAGCT GCTGCTTT GAACACCAGCC CAC CCTCCTTCC CAAGAGT CT CT AT 2812 



2753 



2869 



2813 



GGATCTGCTCCCTCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTT 2928 
III II MM I I I I II I II I I I I I I I I I III I I I I II I I I 

GGAGTTGGCCCCTTGTGTTTCCTTTACCAGTCATGCCATACTGTTT GGGAAGT CAT C 2869 



Qy 2929 CCTGAAGTCTGACCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCT TCT 2985 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I III 
Db 2870 TCTGAAGTCTAACCACCTTCCTTCTTGCTTCAGTTTGGACAGATTGTTATTATTGTCTCT 2929 



Qy 2986 GCCCTGGC-AGAATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACC 3044 

I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I II I I I I I I I I I I 

Db 2930 GCCCTGGCTAGAATGGGGGGCATAATCTGAGCCTTGTTCCCTTGTCCAGTGTGGCTGACC 2989 

Qy 3045 CCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAG 3104 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2990 CTTGACCTCTT — CCTTCCTCCTCCCTTTGTTTGGGGATTCAGAAAACTGCTTGTCACAG 304 7 

Qy 3105 ACTGTTTATTTTTTATTAAAAA 3126 

II I II I I I I I I I I I I I I I I I 
Db 3048 ACAATTTATTTTTTATTAAAAA 3069 
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Query Match 43.7%; Score 1372.2; DB 9; Length 2172; 

Best Local Similarity 71.9%; Pred. No. 0; 

Matches 1560; Conservative 0; Mismatches 611; Indels 0; Gaps 0; 



Qy 105 ATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAA 164 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 1 ATGGCCCTACCATCCCTGGGCCAGGACTCATGGAGTCTCCTGCGTGTTTTTTTCTTCCAA 60 

Qy 165 CTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCC 224 

II I I I I I I I III I I I I I I I I I I I I I I I I II I I I I I I I 

Db 61 CTCTTCCTGCTGCCATCACTGCCACCTGCTTCTGGGACTGGTGGTCAGGGGCCCATGCCC 120 

Qy 225 AGGGTCAGATACTATGCAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGC 284 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I 
Db 121 AGAGT CAAATAC CAT GCT GGAGACGGGCACAGGG C C CT CAGCTT CTT CCAACAAAAAGGC 180 

Qy 285 CTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCT 344 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 181 CTCCGAGACTTTGACACGCTGCTCCTGAGTGACGATGGCAACACTCTCTATGTGGGGGCT 240 

Qy 345 CGAGAAGCCATTCT GGCCTTGGAT AT CCAGGAT CCAGGGGT C C C C AG GCTAAAGAACAT G 404 

I I I I I III I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 241 CGAGAGGCCGT C CT GGCCTTGAAT ATCCAGAAC C CAGGAAT CC CAAGGCTAAAGAACAT G 300 

Qy 405 AT AC CGT GGCCAGC CAGT GAC AGAAAAAAGAGT GAAT GT GC CTTT AAGAAGAAGAGCAAT 464 

I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 301 AT AC CCT GGC CAGCCAGT GAGAGAAAAAAGACC GAAT GT GCCTTTAAGAAGAAGAGCAAT 360 

Qy 4 65 GAGACAC AGT GTTT CAACTT CAT CCGT GTC CT GGTTT CTT ACAAT GT CAC C CATCT CT AC 524 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II 

Db 361 GAGACACAGT GTT TCAACTT CATT CGAGTCCT GGTCT CTT ACAAT GCT ACT C AC CT CT AT 420 

Qy 525 ACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTAC 584 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 421 GCCTGTGGGACCTTTGCCTTCAGCCCTGCCTGTACCTTCATTGAACTCCAAGATTCCCTC 4 80 

Qy 585 CTGTTGCCCATCTCGGAGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCC 644 

I I I I I I I I II I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I 

Db 4 81 CTGTTGCCCATCTTGATAGACAAGGTCATGGACGGGAAGGGCCAAAGCCCCTTTGACCCT 54 0 

Qy 645 GCTCACAAGCATACGGCTGTCTTGGTGGAT GGGATGCT CT ATTCT GGT ACT AT GAACAAC 704 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I 
Db 541 GTTCACAAGCACACAGCT GT CTTGGTC GAT GGGAT GCT TT ATT CC GGC AC CAT GAACAAC 600 

Qy 705 TT CCT GGGCAGTGAGCCCATCCTGATGCGCACACT GGGAT CC CAGC CT GT CCT CAAGACC 764 

I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I II II I I I I II I I I I I I I I I I I I I I 
Db 601 TTCCTGGGCAGCGAGCCCATCCTGATGCGGACACTGGGATCCCAGCCTGTTCTCAAGACT 660 

Qy 765 GACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACC 824 

I I I I I I I I I I I I I I I I I I I I 

Db 661 GACATCTTCTTACGCTGGCTGCACGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 720 

Qy 825 CAGGTCGTCTACTTCTTCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTC 884 

Db 721 NNNNNNNNNNNNNNNNNNNNNN^ 7 80 

Qy 885 CACAC ATCGCGGGTGGCT AGAGTCT GCAAGAAT GACGT GGGC GGCGAAAAGCT GCT GCAG 944 



Db 781 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 84 0 

Qy 945 AAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCC 1004 

Db 841 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 900 

Qy 1005 TTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATC 1064 

Db 901 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 960 

Qy 1065 TACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCC 1124 

I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I 
Db 961 NNNNNNNNNNNNNNNNNNNNNNNGCAGGTT GGCGGGACCAGGAGCTCAGCAGTCTGT GCC 1020 

Qy 1125 TTCT CT CT CT T GGACATT GAAC GT GT CTTT AAGGGGAAAT ACAAAGAGT T GAACAAAGAA 1184 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1021 TT CT CT CT C AC GGACATT GAGC GAGTCTTTAAAGGGAAGTACAAGGAGCT GAACAAGGAG 1080 

Qy 1185 ACTTCACGCTGGACTACTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCA 124 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 ACCTCCCGCTGGACCACTTACCGGGGCTCAGAGGTCAGCCCGAGGCCAGGCAGTTGCTCC 1140 

Qy 1245 GT GGGCCC CT CCTCT GATAAGGCCCTGAC CTT C AT GAAGGAC CAT TT C CT GAT GGAT GAG 1304 

I I I I I I I I I I I I I I I I II III I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 1141 AT GGGCCC CT CCTCT GACAAAGCCTTGAC CTT CAT GAAGGAC CAT TTT CT GAT GGAT GAG 1200 

Qy 1305 CAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTG 1364 

II I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I III 

Db 1201 CACGTGGTAGGAACACCCCTGCTGGTGAAGTCTGGTGTGGAGTACACACGGCTTGCTGTG 1260 

Qy 1365 GAGAC AGCC CAGGGCCTT GAT GGGCAC AGCCAT CTT GT CAT GT ACCT GGGAAC C ACC ACA 1424 

II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 GAGT C AGCT CGGGGCCTT GATGGGAGC AGCCAT GT GGT CAT GT AT CT GGGT AC CT C C ACG 1320 

Qy 1425 GGGTCGCT CCACAAGGCTGTGGTAAGTGGGGACAGCAGTGCTCAT CTGGTGGAAGAGATT 14 84 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1321 GGGTCCCTGCACAAGGCTGTGGTGCCTCAGGACAGCAGTGCTTATCTCGTGGAGGAGATT 138 0 

Qy 1485 CAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCA 1544 

I II I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGCTGAGCCCTGACTCTGAGCCTGTTCGAAACCTGCAGCTGGCCCCCGCCCAGGGTGCA 14 40 

Qy 1545 GTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTAT 1604 

I I I I I I I I I I I I I I I I I I I I I I I I II I I II III I I I I I I II I I I II I I I 
Db 1441 GTGTTTGCAGGCTTCTCTGGAGGCATCTGGAGAGTTCCCAGGGCCAATTGCAGTGTCTAC 1500 

Qy 1605 GAGAGCT GT GT GGACTGTGTCCTT GCCC GGGAC CCCCACT GT GCCTGGGACC CT GAGT CC 1664 

I I I I I I II I I I I II I II I I I I I II I I I II I I II I I I I I I I I I I I I I I I I I I I I II 
Db 1501 GAGAGCTGTGTGGACTGTGTGCTTGCCAGGGACCCTCACTGTGCCTGGGACCCTGAATCA 1560 

Qy 1665 CGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGG 1724 

II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 AGACTCTGCAGCCTTCTGTCTGGCTCTACCAACAGGCCTTGGAAGCAGGACATGGAACGC 1620 

Qy 1725 GGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGC 1784 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



1621 



GGCAACCCGGAGTGGGTATGCACCCGTGGCCCCATGGCCAGGAGCCCCCGGCGTCAGAGC 1680 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 



1785 CGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGC 1844 

I III III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
1681 CCCCCTCAACTAATTAAAGAAGTCCTGACAGTCCCCAACTCCATCCTGGAGCTGCCCTGC 1740 

1845 CCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAA 1904 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I III I II I I I I I 
1741 C C CC AC CTGT CAGCACT GGC CT CTT ACC ACT GGAGTCAT GGCC GAGC CAAAAT CT CAGAA 1800 

1905 GCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGT 1964 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
1801 GCCTCTGCTACCGTCTACAATGGCTCCCTCTTGCTGCTGCCGCAGGATGGTGTCGGGGGC 1860 



1965 



2024 



CT CTACCAGTGCTGGGCAACTGAGAATGGCTTTT CAT ACC CTGT GATCTCCTACT GGGTG 

I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill. 

1861 CTCTACCAGTGTGTGGCGACTGAGAACGGCTACTCATACCCTGTGGTCTCCTATTGGGTA 1920 

2025 GACAGCC AGGAC CAGAC CCT GGCC CTGGAT C CT GAACT GGCAGGC AT C CC C CGGGAGCAT 2084 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I III I I I I I I I I I I I 
1921 GACAGCCAGGACCAGCCCCTGGCGCTGGACCCTGAGCTGGCGGGCGTTCCCCGTGAGCGT 1980 

2085 GTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTAC 2144 

III I I I I I I I I I I I I I I I I I I I I II II II II I I I I I I I I I I I I I I I I I I I 
1981 GTGCAGGTCCCGCTGACCAGGGTCGGAGGCGGAGCTTCCATGGCTGCCCAGCGGTCCTAC 204 0 

2145 TGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATC 2204 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2041 T GGCC CCATTTTCTCATCGTTACCGTCCT CCT GGC CAT CGTGCTCCTGGGAGTGCTCACT 2100 



2205 



2264 



ATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAG 

I I I I I I II I I I I I I II I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2101 CTCCTCCTCGCTTCCCCACTGGGGGCGCTGCGGGCTCGGGGTAAGGTTCAGGGCTGTGGG 2160 

2265 ACCCTGCGCCC 2275 

I I I I I I I I 
2161 ATGCTGCCCCC 2171 



RESULT 8 

BX367242/C 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



GI:46625363 



(human) 



BX367242 1108 bp mRNA linear EST 27-APR-2004 

BX367242 Homo sapiens B CELLS (RAMOS CELL LINE) COT 25-NORMALIZED 
Homo sapiens cDNA clone CS0DL002YO04 3-PRIME, mRNA sequence. 
BX367242 
BX367242.2 
EST. 

Homo sapiens 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 1108) 

Li,W.B., Gruber,C, Jessee, J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 

On May 8, 2003 this sequence version replaced gi: 30455608. 
Contact : Genos cope 



Craniata; Vertebrata; Euteleostomi; 
Catarrhini; Hominidae; Homo. 



Genoscope - Centre National de Sequencage 

2 rue Gaston Cremieux, CP 5706 - 91057 EVRY cedex - FRANCE 
Email: seqref @genoscope . ens . f r , Web : www.genoscope.cns.fr 
1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. This sequence belongs to sequence cluster 
907. f 

For more information about this cluster, see 
http : //www. genoscope . ens . f r/cdna?s=CS0AL002BH02NPl&c=907 . f . 
FEATURES Location/Qualifiers 
source 1 . . 1108 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon:9606" 
/clone="CS0DL002YO04" 

/cell__type="B CELLS (RAMOS CELL LINE) COT 2 5 -NORMAL I ZED" 
/cell_line="RAMOS CELL LINE" 

/clone_JLib="Homo sapiens B CELLS (RAMOS CELL LINE) COT 
25-NORMALIZED" 

/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 

ORIGIN 



Query Match 30.2%; Score 950.6; DB 5; Length 1108; 

Best Local Similarity 94.8%; Pred. No. 4.1e-240; 

Matches 996; Conservative 24; Mismatches 27; Indels 4; Gaps 4; 



Qy 


2073 


CCCCGGGAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCC 


2132 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 II 1 : 1 1 1 1 1 1 1 1 1 1 1 : 1 1 1 1 : 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1049 


CCCCCGGAGCATGT-AAGGTCCCGTTGACMAGGGTCAGTGG-KGGGCSGCCCTGGCTGCC 


992 


Qy 


2133 


CAGCAGTCCTACTGGCCCC-ACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTC 


2191 






1 1 1 : 1 1 1 1 :: 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Mill 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 




Db 


991 


CAGMAGTCMYACTTGCCCCAACTTTGTAACTGTAACTGTCCTCTTTGCCTAAGTGCTTTC 


932 


Qy 


2192 


AGGAGCCCTCATCATCCTCGTGGCCTCCCC-ATTGAGAGCACTCCGGGCTCGGGGCAAGG 


2250 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 : 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 




Db 


931 


AGGAGCCCTCATCATCCTCGTGGCCTCCCCAATTGAGAGMACTCCGGGCTCGGCGCAAGG 


872 


Qy 


2251 


TTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGCAGAGAGCAACACC 


2310 




1 1 : 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


871 


TTMAGGGCT GTGAGACCCTGCGCCCTGGGGAGAAGGC C CCGTTAAGCAGAGAGCAAC AC C 


812 


Qy 


2311 


TCCAGT CTCCCAAGGAATGCAGGACCTCTGCCAGT GAT GT GGAC GCT GACAACAACTGCC 


2370 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 




Db 


811 


TCCAGT CTCC CAAGGAATGCAGGACCTCTGC CAGT GAT GTGGACGCT AACAACAACT GC C 


752 


Qy 


2371 


T AGGCACT GAGGTAGCTTAAACT CTAGGCACAGGCC GGGGCTGC GGT GCAGGCAC CT GGC 


2430 






1 1 1 1 1 1 1 1 1 1 1 1 1 : 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


751 


TAGGCACTGAGGTMGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCACCTGGC 


692 



Qy 2431 CATGCTGGCTGGGC GGCCCAAGCAC AGC CCT GACT AGGAT GACAGCAGC ACAAAAGACC A 

I I I II I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I : II I I I I I II I I I I I I I M I 



2490 



Db 



691 



C AT GCTGGCT GGGCGGCC CAAGMAC AGCC CT GACT AGGAT S ACAGCAGC ACAAAAGAC CA 632 



Qy 2491 CCTTTCTCCCCT GAGAGGAGCT T CT GCT ACT CT GC AT C ACT GAT GACACT C AGCAGGGTG 2550 

I I I I I I I I I I I II I I I I I I 1 I I I I I I I I I I I I I I I I I : I I I I I I : I I I I I I I I I I I I I I I 
Db 631 CCTTTCTCCCCT GAGAGGAGCTT CTGCTACT CTGC ATMACT GAT VAC ACT CAGCAGGGTG 572 

Qy 2551 ATGCACAGCAGTCTGCCTCCCCTATGGGACTCCCTTCTACCAAGCACATGAGCTCTCTAA 2610 

III I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 571 AT GAACAGCAGT CT GCCT CCCCTATGGAACT CC CT T CTACCAAGCAC AT GAGCT CT CTAA 512 

Qy 2611 CAGGGT GGGGGCTAC CCC CAGACCT GCT C CT ACACT GAT ATT GAAGAAC CT GGAGAGGAT 2670 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 511 CAGGGT GGGGGCTACC CC CAGACCT GCT C CTAAACT GAT ATT GAAGAAC CT GGAGAGGAT 452 

Qy 2671 CCTT CAGTT CT GGCCATT C CAGGGACCCT CCAGAAACACAGT GTT T CAAGAGACC CTAAA 2730 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 451 CCTTCAGT T CTGGCCATT C CAGGGACCCT C CAGAAACACAGT GTTT CAAGAGACCCTAAA 392 

Qy 2731 AAAC CT GC CT GTCCCAGGACC CT AT GGTAAT GAACAC CAAACAT CTAAACAAT CAT AT GC 2790 

I I I I I I I I : I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I 
Db 391 AAACCTGCMTGT CCCAGGACC CTAT GGTAAT GAAC AC CAAACAT CTAAAAAATAAT AT GC 332 

Qy 2791 TAACATGCCACTCCTGGAAACTCCACTCTGAAGCTGCCGCTTTGGACACCAACACTCCCT 2850 

111:1111 II I I I I I I I I I I I I : I : I I I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I 
Db 331 TAAMATGCAACTCCTGGAAACTCMAMTCTGAAGCTGCCGCTTTGAAMACCAAAACTCCCT 272 

Qy 2851 TCTCCCAGGGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCAGTCGTGCACCGCT 2 910 

I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I I I II I I I I I I I I : I II I I I I : I I III 
Db 271 TCTCCCAGGGTCATGMAGGGATCTGCTCCCTCCTGCTTCCCTTACMAGTCGTGMACAGCT 212 

Qy 2911 GACTCCCAGGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCTTCAGTTGGGGCAG 2970 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I 111111:1 I 
Db 211 AACTCCCAGGAAGTCTTCCCTGAAGTCTGACCACCTTTCNTCTAGCTTAAGTTGGRGAAA 152 

Qy 2971 ACTCTGATCCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTT 3030 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 151 ACTCT GAT C CCTT CTGC CCTGGCAGAATGGCAGGGGTAATNTGAGCCTTCTTAACT CCTT 92 

Qy 3031 TACCCTAGCTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAA 3090 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 91 TACCCTAGCTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAA 32 

Qy 3091 ACTGCTTGTCAGAGACTGTTTATTTTTTATT 3121 

I I I I I I I I I I I I I I I I I I I I I : : I I I I II 
Db 31 ACTGCTTGTCAGAGACTGTTTCBYTTTTCTT 1 



RESULT 9 

BX363741/c 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



BX363741 

BX363741 Homo sapiens B 
Homo sapiens cDNA clone 
BX363741 

BX363741.2 GI: 46554166 
EST. 

Homo sapiens (human) 
Homo sapiens 



1064 bp mRNA linear EST 23-APR-2004 
CELLS (RAMOS CELL LINE) COT 25-NORMALI ZED 
CS0DL005YC17 3-PRIME, mRNA sequence. 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 1064) 

Li,W.B., Gruber,C, Jessee, J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 

On May 5, 2003 this sequence version replaced gi: 30384744. 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 

2 rue Gaston Cremieux, CP 5706 - 91057 EVRY cedex - FRANCE 
Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 

1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. This sequence belongs to sequence cluster 
907. f 

For more information about this cluster, see 

http://www.genoscope.cns . f r/cdna?s=CS0DL005AB09NPl&c=907 . f . 
Location/Qualifiers 
1. .1064 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="CS0DL005YC17" 

/cell_type="B CELLS (RAMOS CELL LINE) COT 25-NORMALIZED" 
/cell_line="RAMOS CELL LINE" 

/clone_lib="Homo sapiens B CELLS (RAMOS CELL LINE) COT 
25-NORMALIZED" 

/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



ORIGIN 



Query Match 29.5%; Score 926.2; DB 5; 

Best Local Similarity 95.5%; Pred. No. 1.2e-233; 
Matches 1000; Conservative 15; Mismatches 24; 



Length 1064; 



Indels 



8 ; Gaps 



6; 



Qy 2058 GAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGG 2117 

I I I I I Mill II II : I : I I I I I I I I I I I I : I I I I I I I I I I I I I 

Db 1040 GAT CTGAAT GGCAGCATC C CC GGGAGMWGKGARGT C C CGT T GAC C- RGGT CAGT GGT GGG 982 



Qy 

Db 

Qy 

Db 

Qy 
Db 



2118 GCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCACTGTCACTGTCCTCTTT 2177 
I II I : I I I I I I I I I I I I : I : I I III I I I I I I I I I I I I I I I I I I I I I I I I 
981 — CCGCCCTGGYGCCCAGCAGTCCWAYTG — CCCCATTTGTCACTGTCACTGTCCTCTTT 926 

2178 GCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCCCATTGAGAGCACTCCGG 2237 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
925 GCCTTAGTGCTTTCA-GAGCCCTCATCATCCTCGT-GCCTCCCCATTGAGAGCACTCCGG 868 

2238 GCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGC 2297 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
867 GCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGC 808 



Qy 



2298 AGAGAGCAACACCTCCAGT CT CCCAAGGAAT GC AGGAC CT CT GCC AGTGATGT GGAC GCT 2357 

I I I I I I III Ml I II I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I i I I It I 



Db 807 AGAGAGCAACACCT CCAGT CT C C CAAGGAAT GCAGGACCTCT GCCAGT GAT GT GGAC GCT 748 

Qy 2358 GACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGT 2417 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I II I 

Db 747 GACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGT 688 

Qy 2418 GCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCTGACTAGGATGACAGCA 2477 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I 
Db 687 GCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCTGACTAGGATGACAGCA 628 

Qy 2478 GCACAAAAGAC CACCTTT CT CCC CT GAGAGGAGCT T CT GCT ACT CT GCAT CACT GAT GAC 2537 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II II I I 
Db 627 GCACAAAAGAC CAC CTTTCT CCC CT GAGAGGAGCTT CT GCT ACT CT GCAT CACT GAT GAC 568 

Qy 2538 ACT CAGCAGGGTGAT GCACAGC AGT CT GCCT CCC CT AT GGGACT C C CTT CTAC CAAGCAC 2597 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 567 ACT CAGCAGGGTGAT GCACAGC AGT CT GC CT C C C CT AT GGGACT C C CTT CTAC CAAGCAC 508 

Qy 2598 ATGAGCT CT CTAACAGGGTGGGGGCTAC CCC CAGACCT GCT CCT ACACT GAT ATT GAAGA 2657 

I I I I II I I I I II I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I II I II I I I I II 

Db 507 AT GAGCT CT CTAACAGGGTGGGGGCTAC CC C CAGAC CT GCT C CTAC ACT GAT ATT GAAGA 448 

Qy 2658 ACCT GGAGAGGAT C CTT CAGTT CTGGCCATT C CAGGGAC CCT C CAGAAACAC AGT GTTT C 2717 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 447 ACCT GGAGAGGAT CCTT CAGTT CTGGCCATT C CAGGGAC CCT C CAGAAACAC AGT GTTT C 388 

Qy 2718 AAGAGACCCTAAAAAACCTGC CT GT CCCAGGACCCT AT GGTAAT GAACAC CAAACAT CT A 2777 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I II II I I I I I II I I I I I I 
Db 387 AAGAGAC C CTAAAAAAC CTGC CT GT CCC AGGACC CT AT GGTAAT GAACAC CAAACAT CT A 328 

Qy 2778 AACAATCATATGCTAACATGCCACTCCTGGAAACTCCACTCTGAAGCTGCCGCTTTGGAC 2837 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 327 AACAATCATATGCTAACATGCCACTCCTGGAAACTCCACTCTGAAGCTGCCGCTTTGGAC 268 

Qy 2838 ACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCA 2897 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I II I II 
Db 267 ACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCA 208 

Qy 2898 GTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGT CTGAC CACCTTT CTT CTTGCT 2957 

I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I I I I I I 

Db 207 GTCGTGCACCGCTGACTYCCAGGAAGTCTTCCCTGAAKTCTGACCACCTTTCTTCTTGCT 148 

Qy 2958 T CAGTT GGGGCAGACT CT GAT C CCTTCT GCCCTGGCAGAAT GG~ C AGGGGTAAT CT GAGC 3016 

I I II I I I I I I I I I I : I : I I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I I I I I I I 
Db 147 T CAGTT GGGGCAGAYT YT GAT C CCTTCT GC C CT GG YAGAAT GGT C AGGGGTAAT CT GAGC 88 

Qy 3017 CTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTT 307 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I : I I I I I I I I I : I : : I I I I I I I I I I I I I 

Db 87 CTTCTTCACTCCTTTACCCTAGCTGACCCCTTCMCCTCTCCCCBTSSCTTTTCCTTTGTT 28 

Qy 3077 TTGGGATTCAGAAAACTGCTTGTCAGA 3103 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 27 TTGGGATTCAGAAAACTGCTTGTCAGA 1 



RESULT 10 
BX350606/C 



LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



BX350606 922 bp mRNA linear EST 08-APR-2004 

BX350606 Homo sapiens B CELLS (RAMOS CELL LINE) COT 25-NORMALIZED 
Homo sapiens cDNA clone CS0DL005YC17 3-PRIME, mRNA sequence. 
BX350606 

BX350606.1 GI: 30373499 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 922) 
Li,W.B. , Gruber,C. , 



FEATURES 

source 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 

and Polayes,D. 



Jessee, J. 

Full-length cDNA libraries and normalization 
Unpublished (2001) 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 

2 rue Gaston Cremieux, CP 5706 - 91057 EVRY cedex - FRANCE 
Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 
1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. This sequence belongs to sequence cluster 
907. f 

For more information about this cluster, see 

http://www.genoscope.cns. fr/cdna?s=CS0BAI043ZD06_CS04076_l&c=907 . f . 
Location/ Qualifiers 
1. .922 

/organism="Homo sapiens" 
/mol__type="mRNA" 
/db_xref="taxon:9606" 
/clone="CS0DL005YC17" 

/cell_type="B CELLS (RAMOS CELL LINE) COT 25-NORMALIZED" 
/cell_line="RAMOS CELL LINE" 

/clone_lib="Homo sapiens B CELLS (RAMOS CELL LINE) COT 
25-NORMALIZED" 

/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



ORIGIN 



Query Match 27.8%; 
Best Local Similarity 98.7%; 
Matches 878; Conservative 



Score 874.4; DB 5 
Pred. No. 6.1e-220 
0; Mismatches 12 



Length 922; 

Indels 0; Gaps 0; 



Qy 1372 CCCAGGGCCTTGATGGGCACAGCCATCTTGTCAT GTACCT GGGAACCACCACAGGGTCGC 1431 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 919 CCCAGGNCCTTGATGGGCACAGCCATCTT GTCATGTACTT GGGAACCACAACAGGGT CGC 860 



Qy 1432 TCCACAAGGCTGT GGTAAGT GGGGACAGCAGT GCT CAT CT GGT GGAAGAGATT CAGCT GT 1491 

I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 859 TCCACAAGACTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATTCAGCTGT 800 



Qy 1492 TCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTG 1551 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II i I I I I I I I I I I I I I I I I I I I 

Db 799 TCCCTGACCCTGANCCTGTTCGCAACCTGCAGCTGGCCNCCACCAAGGGTGCAGTGTTGN 740 



Qy 1552 
Db 739 



T AGGCTT CT CAGGAGGT GTCT GGAGGGT GC C C C GAGC CAACT GT AGT GT CT AT GAGAGCT 
I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I II I I I 
T AGGCTT CT CAGNAGGT GT CT GGAGGGT GCNCC GAGC CAACT GT AGT GT CT AT GAGAGCT 



1611 
680 



Qy 1612 GTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCT 1671 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 679 GTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCT 620 

Qy 1672 GTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACC 1731 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I 

Db 619 GTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACC 560 

Qy 1732 CAGAGTGGGCAT GT GCCAGT GCC CCCATGAGCAGGAGCCT T C GGC CT CAGAGC CGC C C GC 1791 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 559 CAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGC 500 

Qy 1792 AAAT CATTAAAGAAGT CCT GGCT GT CCC CAACT CCAT CCT GGAGCT CCCCTGCCCC C ACC 1851 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I 
Db 4 99 AAAT CATTAAAGAAGT CCT GGCT GT CCCTAACT C CAT C CT GGAGCT CCCCTGCCCC C ACC 440 

Qy 1852 TGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTT 1911 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I 
Db 439 TGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTT 380 

Qy 1912 CCACTGTCTACAATGGCT CCCTCTTGCT GATAGTGCAGGATGGAGTT GGGGGT CTCTACC 1971 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 379 CCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACC 320 

Qy 1972 AGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCC 2 031 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I II 
Db 319 AGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCC 2 60 

Qy 2032 AGGACCAGAC CCT GGCCCT GGAT CCT GAACT GGCAGGCAT CC CC CGGGAGCAT GT GAAGG 2 091 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I II I I 
Db 259 AGGACCAGAC CCTGGC C CT GGAT CCT GAACT GGCAGGCAT CCCCCGGGAGCAT GT GAAGG 200 

Qy 2092 TCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCC 2151 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 199 TCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCC 14 0 

Qy 2152 ACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCG 2211 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 139 ACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCG 80 

Qy 2212 TGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGT 2261 

I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 79 TGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGT 30 



RESULT 11 
BX384966 

LOCUS BX384966 934 bp mRNA linear EST 23-APR-2004 

DEFINITION BX384966 Homo sapiens B CELLS (RAMOS CELL LINE) COT 25-NORMALIZED 

Homo sapiens cDNA clone CS0DL005YC17 5-PRIME, mRNA sequence. 

ACCESSION BX384966 

VERSION BX384966.2 GI: 46556002 



KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 934) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 

On May 8, 2003 this sequence version replaced gi: 30436505. 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 

2 rue Gaston Cremieux, CP 5706 - 91057 EVRY cedex - FRANCE 
Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 

1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. This sequence belongs to sequence cluster 
907. f 

For more information about this cluster, see 

http : //www. genoscope . ens . f r/cdna?s=CS0DL005AB09QPl&c=907 . f . 

Location/Qualifiers 

1. .934 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="CS0DL005YC17" 

/cell_type="B CELLS (RAMOS CELL LINE) COT 25-NORMALIZED" 
/cell_line="RAMOS CELL LINE" 

/clone_lib="Homo sapiens B CELLS (RAMOS CELL LINE) COT 
25-NORMALIZED" 

/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



ORIGIN 



Query Match 27.0%; 
Best Local Similarity 97.0%; 
Matches 871; Conservative 



Score 849.2; DB 5; 
Pred. No. 2.9e-213; 
4; Mismatches 22; 



Length 934; 



Indels 



1; Gaps 



l; 



Qy 

Db 



99 CTGAGCATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTC 158 

I I I I I I I I I I II I I I II I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1 CTGAGCATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTC 60 



Qy 

Db 



159 TTCCAACTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCC 218 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
61 TTCCAACTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCC 120 



Qy 

Db 



219 ATGCCCAGGGTCAGATACT AT GCAGGGGAT GAAC GT AGGGCACTT AGCTT CT T C C ACC AG 278 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
121 AT GC C CAGGGTCAGAT ACTAT GCAGGGGAT GAAC GTAGGGCACT T AGCTT CT T C C ACC AG 180 



Qy 279 AAGGGC CTC CAGGATTTT GAC ACT CTGCTCCT GAGT GGT GAT GGAAAT ACT CT CT ACGT G 338 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 181 AAGGGCCTCCAGGATTTTGACACTCTGCTCCTGAGTGCTGAT GGAAAT ACTCTCTACGTG 240 



Qy 

Db 



339 
241 



GGGGCTCGAGAAGCCATTCTGGCCTTGGATATCCAGGATCCAGGGGTCCCCAGGCTAAAG 398 

I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGGGCTCGAGAAGCCATTCTGGCCTTGGATATCCAGGATCCAGGGGTCCCCAGGCTAAAG 300 



Qy 399 AAC AT GAT AC C GTGGC C AGCCAGT GACAGAAAAAAGAGT GAAT GT GCCTT TAAGAAGAAG 458 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 301 AAC AT GAT ACCGT GGC C AGC CAGT GACAGAAAAAAGAGT GAAT GT GCCTT TAAGAAGAAG 360 

Qy 459 AGCAATGAGACACAGT GTTT CAACTT CAT C CGT GT C CT GGTT TCTT ACAAT GT CAC C CAT 518 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 AGCAATGAGACACAGT GTTT CAACTT CAT C CGT GT C C T GGTTT CTT ACAAT GT CACC C AT 420 

Qy 519 CTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGAT 578 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 CTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGAT 480 

Qy 579 TCCTACCTGTTGCCCATCTCGGAGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTT 638 

I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I II I I I 

Db 481 TCCTACCTGTTGCCCATCTCGGAGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTT 540 

Qy 639 GAC CC CGCT CACAAGCAT AC GGCT GT CTT GGT GGAT GG GAT GCT CT ATT CT GGT ACT AT G 698 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 GAC CC CGCT CACAAGCAT AC GGCT GT CTT GGT GGAT GGGAT GCT CT ATT CT GGT ACT AT G 600 

Qy 699 AACAACTTCCTGGGCAGTGAGCCCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTC 758 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 AACAACTT CCT GGGCAGT GAGC C CAT CCT GAT GC GC AC ACT G GGAT C C C AGC CT GT CCTC 660 

Qy 759 AAGACCGACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCT 818 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 AAGACCGACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCT 720 

Qy 819 TCGACCCAGGTCGTCTACTTCTTCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAG 878 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 T CGACCCAGGT CGT CT ACT TCTTCTTC GAGGAGACAGCCAGCGAGTTT GACT T CTT T GAG 780 

Qy 879 AGGCTCCACACATCGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTG 938 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 111:111 

Db 781 AGGCTCCACACATCGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGCG-AAARCTG 839 

Qy 939 CTGCAGAAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGC 996 

I I I I I I I I I I I I I I I I I I : I I I I I MM: : I I I I I II 

Db 840 CTGCAGAAGAAGTGGACCMCCTCCTGAAGCCCACYGCYCTCMCCAGCCCGGGCACTGC 897 



RESULT 12 

BX328255 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



BX328255 897 bp mRNA linear EST 07-APR-2004 

BX328255 Homo sapiens B CELLS (RAMOS CELL LINE) COT 25-NORMALIZED 
Homo sapiens cDNA clone CS0DL005YC17 5-PRIME, mRNA sequence. 
BX328255 

BX328255.2 GI: 46262160 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebra ta; Euteleostomi; 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 897) 

Li,W.B., Gruber,C, Jessee, J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 

On May 1, 2003 this sequence version replaced gi: 30307730. 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 

2 rue Gaston Cremieux, CP 5706 - 91057 EVRY cedex - FRANCE 
Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 

1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. This sequence belongs to sequence cluster 
907. f 

For more information about this cluster, see 

http : //www. genoscope . ens . f r/cdna?s=CS0BAG053ZH06_CS05040_l&c=907 . f . 
Location/Qualifiers 
1. .897 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon:9606" 
/clone="CS0DL005YC17" 

/cell_type="B CELLS (RAMOS CELL LINE) COT 25-NORMALIZED" 
/cell_line="RAMOS CELL LINE" 

/clone_lib="Homo sapiens B CELLS (RAMOS CELL LINE) COT 
25-NORMALIZED" 

/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



ORIGIN 



Query Match 26.7%; 
Best Local Similarity 99.0%; 
Matches 886; Conservative 



Score 839; DB 5; Length 897; 
Pred. No. 1.5e-210; 
0; Mismatches 5; Indels 



4; Gaps 



4; 



Qy 

Db 



8 05 T GGCAGCCAT C CCTT C GAC CCAGGT C GT CT ACT T CTT CTT CGAGG- AGACAGC CAGC GAG 8 63 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1 TGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGAGGAAGACAGCCAGCGAG 60 



Qy 

Db 

Qy 

Db 

Qy 

Db 



864 TTT GACTTCTTT GAGAGGCT C CACACAT C GCGGGT GGCT AGAGT CT GCAAGAAT GACGT G 923 

I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

61 TTTGACTTCTTT GAGAGGCT C CACACAT C GCGGGT GGCT AGAGT CT GCAAGAAT GACGT G 120 

924 GGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGC 983 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

121 GGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGC 180 

984 ACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGAT 1043 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

181 ACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGAT 240 



Qy 1044 TCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACC 1103 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 TCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACC 300 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



1104 AGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTTTAAGGGGAAA 1163 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I 

AGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTTTAAGGGGAAA 360 



301 



1164 TACAAAGAGTT GAACAAAGAAACTT CAC GCT GGACT ACT T AT AGGG GCC CT GAGACCAAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
361 TACAAAGAGTT GAACAAAGAAACTT CAC GCT GGACT ACTT AT AGGG GC C CT GAGAC CAAC 

1224 CCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGATAAGGCCCTGACCTTCATGAAG 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
421 CCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGATAAGGCCCTGACCTTCATGAAG 



1223 



420 



1283 



480 



1343 



1284 GACCATTTCCT GATGGAT GAGCAAGTGGTGGGGACGC C C CT G CT G GT GAAAT CT GGC GT G 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
481 GACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGCCCCTGCTGGT GAAAT CTGGCGTG 540 

1344 GAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCCTTGATGGGCACAGCCATCTTGTC 1403 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 GAGTATACAC GGCTT GCAGTGGAGACAGCC C AGGGC CT T GAT GGGC AC AGC C AT CTTGT C 600 

1404 AT GTAC CT GGGAAC CACCACAGGGT CGCTC C ACAAGGCT GT GGTAAGT GGGGACAGC AGT 1463 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AT GTAC CT GGGAAC CAC C ACAGGGT CGCTC CACAAGGCT GT GGTAAGT GGGGACAGC AGT 



601 



660 



1464 GCT CAT CTGGT GGAAGAGATT CAGCTGTTC C CT GACC CT GAACCT GTT C GC AACCT GC AG 1523 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I 
661 GCT CAT CTGGT GGAAGAGATT CAGCTGTTCC CT GACC CT GAAC CT GTT C GCAACCT GC AG 720 

1524 CTGGCCCCCACCCAGGGTGCA-GTGTTTGTAGGCTTCTCAGGAGGTGTCTGG-AGGGTGC 1581 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I 

721 CTGGCCCCCACCCCAGGTGCANGTGTTTGTAGGCTTCTCAGGAGGTGTCTGGNAGGGTGC 7 80 

1582 C C C GAGC CAACT GT AGT GT CT AT GAGAGCT GTGT GGACT GT GT C CTT GC C C GGGACC C C C 1641 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
781 CCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCCGGACCCCC 840 

1642 ACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAACCT 1696 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

841 -CTGTGCCTGGGACCCTGAGTCCCGACCCTGTTGCCTTCTGTCTGCCCCCAACCT 894 



RESULT 13 

BQ057192 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 



BQ057192 974 bp mRNA linear EST 29-MAR-2002 

AGENCOURT_6769628 NIH_MGC_99 Homo sapiens cDNA clone IMAGE : 5812383 
5', mRNA sequence. 
BQ057192 
BQ057192.1 
EST. 

Homo sapiens 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 974) 
NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 



GI: 19816532 



(human) 



Craniata ; Vertebrata ; Euteieos tomi ; 
Catarrhini; Hominidae; Homo. 



JOURNAL 
COMMENT 



FEATURES 

source 



Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email : cgapbs-r@mail . nih. gov 

Tissue Procurement: Lou Staudt 
cDNA Library Preparation: Rubin Laboratory 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 

found through the I.M.A.G.E. Consortium/ LLNL at: 

http : //image . llnl . gov 

Plate: LLCM2062 row: 1 column: 16 

High quality sequence stop: 714. 
Location/ Qualifiers 
1. .974 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon:9606" 

/clone=" IMAGE: 5812383" 

/ t is sue_type= "lymphoma, cell line" 

/lab_host="DH10B (phage-resistant ) " 

/clone_lib="NIH_MGC_99" 

/note="Organ: lymph; Vector: pOTB7; Site_l: Xhol; Site_2: 
EcoRI; cDNA made by oligo-dT priming. Directionally cloned 
into EcoRI/XhoI sites using the following 5' adaptor: 
GGCACGAG(G). Size-selected >500bp for average insert size 
1.8kb. Library constructed by Ling Hong in the laboratory 
of Gerald M. Rubin (University of California, Berkeley) 
using ZAP-cDNA synthesis kit (Stratagene) and Superscript 
II RT (Life Technologies). Note: this is a NIH_MGC 
Library. " 



ORIGIN 



Query Match 26.3%; 
Best Local Similarity 92.6%; 
Matches 902; Conservative 



Score 827.4; DB 5; Length 974; 
Pred. No. 1.8e-207; 
0; Mismatches 67; Indels 5; 



Gaps 



3; 



Qy 

Db 



92 TCTGTGGCTGAGCATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCT 151 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1 TCTGTGGCTGAGCATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCT 60 



Qy 

Db 



152 TTTCCTCTTCCAACTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCA 211 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

61 TTTCCTCTTCCAACTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCA 120 



Qy 

Db 

Qy 

Db 

Qy 

Db 



212 GGGGCCCAT GCC CAGGGTCAGAT ACTAT GCAGGGGAT GAAC GT AGGGCACTT AGCT T CTT 271 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 GGGGCCCATGCCCAGGGTCAGATACTATGCAGGGGATGAACGTAGGGCACTTAGCTTCTT 180 

272 C C ACCAGAAGGGC CT C CAGGAT TT T GACACT CT GCT CCT GAGTGGTGATGGAAATACT CT 331 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

181 CCAC CAGAAGGGCCT CCAGGATTTT GACACT CT GCT CCT GAGT GGT GAT GGAAAT ACT CT 240 

332 CTACGTGGGGGCTCGAGAAGCCATTCTGGCCTTGGATATCCAGGATCCAGGGGTCCCCAG 391 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I 
241 CTACGT GGGGGCT CGAGAAGC C ATT CT GGC CT T GGAT AT CCAGGAT CCAGGGGT CC C CAG 300 



Qy 



392 GCTAAAGAACAT GAT ACC GTGGCCAGCC AGT GACAGAAAAAAGAGTGAAT GT GC CT TT AA 4 51 



301 GCTAAAGAACAT GATAC CGT GGCCAGCCAGT GAC AGAAAAAAGAGT GAAT GT GC CT TTAA 360 



Qy 452 GAAGAAGAGCAAT GAGACACAGTGTTTCAACTT CAT C C GT GT CCT GGTT T CTT ACAAT GT 511 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GAAGAAGAGCAAT GAGACACAGTGTTTCAACTT CAT CCGT GTCCTGGTTTCTT ACAAT GT 420 

Qy 512 CACCCATCTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACT 571 

I I I I I I I I I I I I) I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 CACCCATCTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACT 480 

Qy 572 T C AAGATT CCTACCT GTTGCCCATCT CGGAGGACAAGGT C AT GGAGGGAAAAGGC CAAAG 631 

I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 81 TCAAGATTCCTACCTGTTGCCCATCTCGGAGGACAAGGTCATGGAGGGAAAAGGCCAAAG 54 0 

Qy 632 CCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGTGGATGGGATGCTCTATTCTGG 691 

I I II I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGTGGATGGGATGCTCTATTCTGG 600 

Qy 692 TACTAT GAACAACTT CCTGGGCAGT GAGC CCAT CCT GAT G C GCACACT GGGAT C C C AGC C 751 

I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 601 TACTAT GAACAACTT CCTGGGCAGT GAGC CCAT C CT GAT GC GCACACTGGGAT C C CAGC C 660 

Qy 752 TGTCCTCAAGACCGACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGC 811 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 TGTCCTCAAGACCGACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGC 720 

Qy 812 CAT CC CTT CGACCCAGGTCGT CT ACTT CTT CTT C GAGGAGAC AGCCAGC GAGTTT GACTT 871 

II I I II I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I 

Db 721 CAT CC CTT C GACCC AGGT CGT CT ACTTCT T CTT C GGAGAGAC AGC CAGC GAGTTT GACTT 780 

Qy 872 CTTTGAGAGGCTCCACACATCGCGGGTGG-CTAGAGTCTGCAAGAATGACGTGGGC-GGC 929 

I I I I I I I I I I I II I II I I I I II III I I I I I II I I I II I I I I I I I I III 
Db 781 CTTTGAGAGGCCCCCACCCTCCCGGGGGGCCTANAGTCTGCCAAAATGACGTGGGCGGGC 84 0 

Qy 930 GAAAAGCTGCTGCAGAAGAA GTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACC 986 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 841 GAAAAGCTGCTGCAAAAAAAAGTGGACCCCCCTTCCTTGAAGGCCCAGCTGCTCTGGCCC 900 

Qy 987 CAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCT 1046 

I I I I I I I III I I II I I I I I I I I 

Db 901 CCAGCCGGGGGGAGCTTGCCCTTTCACGTCATTCCCGCCCCCGGGGTCCTGGCTCCCCCC 960 

Qy 1047 CCCACAGCTCCCCA 1060 

III I I I II I 

Db 961 CCGAATTTTCCCCA 974 



RESULT 14 

BX390196 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 



BX390196 944 bp mRNA linear EST 29-APR-2004 

BX390196 Homo sapiens NEUROBLASTOMA COT 50-NORMALIZED Homo sapiens 
cDNA clone CS0DD003YE08 5-PRIME, mRNA sequence. 
BX390196 

BX390196.2 GI : 46873199 
EST. 

Homo sapiens (human) 



ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 944) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 

On May 8, 2003 this sequence version replaced gi: 30463276. 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 

2 rue Gaston Cremieux, CP 5706 - 91057 EVRY cedex - FRANCE 
Email: seqref ©genoscope . ens . fr, Web : www.genoscope.cns.fr 

1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. This sequence belongs to sequence cluster 
907. f 

For more information about this cluster, see 

http://www.genoscope.cns . f r/cdna?s=CS0BAG009ZD12__CS00860_l&c=907 . f . 
Location/Qualifiers 
1. .944 

/organism= M Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon:9606" 
/clone="CS0DD003YE08" 

/ tissue_type= "NEUROBLASTOMA COT 50-NORMALIZED" 
/clone_lib="Homo sapiens NEUROBLASTOMA COT 50-NORMALIZED" 
/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



ORIGIN 



Query Match 26.1%; 
Best Local Similarity 97.4%; 
Matches 897; Conservative 



Score 820.4; DB 5; 
Pred. No. 1.3e-205; 
0; Mismatches 17; 



Length 944; 
Indels 7; 



Gaps 



6; 



Qy 1535 CCAGGGTGCAGTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTG 1594 

I I I I I I I I I I I I I I I I I I I I I II I 11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 CCAGGGTGCAGTGTTTGTAGGCTTCT-AGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTG 59 



Qy 

Db 

Qy 

Db 

Qy 

Db 



1595 



60 



TAGTGTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGA 1654 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

TAGTGTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGA 119 



1655 CCCTGAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGA 1714 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

120 CCCTGAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGA 179 

1715 CAT GGAGCGGGGGAACCCAGAGT GGGCAT GT GC C AGT GGCC C CAT GAGC AGGAGC CTT CG 1774 
I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
180 CATGGAGCGGGGGAACCCAGAGT GGGCAT GTGCCAGTGGCCCCATGAGCAGGAGC CTT CG 239 



Qy 1775 GCCTCAGAGCCGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGA 1834 

II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 240 GCCTCAGAGCCGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCTAACTCCATCCTGGA 299 



Qy 

Db 



1835 GCTCCCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGC 1894 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

300 GCTCCCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGC 359 



Qy 1895 AGT C CCAGAAGCCT CTT C CACT GT CTACAAT GGCT CC CT CT T GCT GAT AGT G C AG GAT GG 1954 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 360 AGTCCCAGAAGCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGG 419 

Qy 1955 AGTTGGGGGTCTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTC 2014 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I 
Db 420 AGTT GGGGGT CTCTAC CAGT GCT GGGCAACT GAGAAT GGCT T T T C AT ACCCT GT GAT CT C 479 

Qy 2015 CT ACTGGGT GGACAGC C AGGAC CAGAC CCTGGC C CT GGATC CT GAACT GGCAG GCAT CC C 2074 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 480 CTACTGGGTGGACAGCCAGGACCAGACCCTGGCCCTGGATCCTGAACTGGCAGGCATCCC 539 

Qy 2075 CCGGGAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCA 2134 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 540 CCGGGAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCA 599 

Qy 2135 GCAGTCCTACTGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGG 2194 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 600 GCAGTCCTACTGGCCCCACTNTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGG 659 

Qy 2195 AGCCCTCATCATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTC- 2253 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 660 AGCCCTCATCATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTTCGGGCAAGGTTCA 719 

Qy 2254 AGGGCTGTGAGACCCTGCGCCCTGGGG— AGAAGGCCCCGTTAAGCAGAGAGCAACA-CC 2310 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 720 AGGGCTGTGAGACCCTGCGCCCTGGGGGAGAAGGGCCCCGTTAAGCAGAGAGCAACACCC 779 

Qy 2311 T CCAGT CT C C CAAGGAAT GC AGGAC CT CT GC CAGT GAT GTGGACG- CT GACAACAACTGC 2369 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I II I I I I I I I I I I I I I I I I 
Db 780 TT CAGT CT C C CAAGGAAT GCAGGACCT CT GCCAGT GAT GT GGGCGC CT GACAACAACT GC 839 

Qy 2370 CTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCACCTGG 2429 

I I I I I I I I I I I II I I I I I I I I I I I I I I MINI I I I II I I I I I I I I I I I I I I I 

Db 840 CTAGGCACTGAGGTAGCTTAAACTCTA-GCACAGCCCGGGCTTGCGGGGCAGCCACCTGC 898 

Qy 2430 CCATGCTGGCTGGGCGGCCCA 2450 

I I I I I II I I I I I I I I I I I I 
Db 899 CCATGCTGTGTGGGCGGCCCA 919 



RESULT 15 

CB243787/C 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



797 bp mRNA linear EST 12-FEB-2003 
si UI-CF-FN0 Homo sapiens cDNA clone 
3', mRNA sequence. 



CB243787 

UI-CF-FN0-agg-a-05-0-UI 
UI-CF-FN0-agg-a-05-0-UI 
CB243787 

CB243787. 1 GI: 28365431 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebra ta; Euteleostomi ; 



REFERENCE 
AUTHORS 
TITLE 

JOURNAL 
MEDLINE 
PUBMED 
COMMENT 



FEATURES 

source 



Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 797) 

Bonaldo,M. F. , Lennon,G. and Soares, M.B. 

Normalization and subtraction: two approaches to facilitate gene 
discovery 

Genome Res. 6 (9), 791-806 (1996) 

97044477 

8889548 

Contact: McCray, PB 
McCray Lab 
University of Iowa 

2024 University of Iowa Med Labs, Iowa City, IA 52242, USA 

Tel: 319 356 4866 

Fax: 319 356 7171 

Email: paul-mccray@uiowa.edu 

Tissue Procurement: Dr. M. J. Welsh, University of Iowa 
cDNA Library preparation: Dr. M. Bento Soares, University of Iowa 
cDNA Library Arrayed by: Dr. M. Bento Soares, University of Iowa 
DNA Sequencing by: Dr. M. Bento Soares, University of Iowa 
Clone Distribution: Researchers may obtain clones from Research 

Genetics (www.resgen.com) or from Open Biosystems 

(www.openbiosystems.com) . 

The following repetitive elements were found in this cDNA 
sequence: 1-46, >AT_rich#Low_complexity (matched compliment) 
Seq primer: M13 FORWARD 
P0LYA=Yes . 

Location/ Qualifiers 
1. .797 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon:9606" 

/clone="UI-CF-FN0-agg-a-05-0-UI" 

/tissue_type="Human Lung Epithelial cells" 

/lab_host="DH10B (Life Technologies) (Tl phage resistant)' 
/clone__lib="UI-CF-FN0" 

/note="0rgan: Lung; Vector: pT7T3-Pac (Pharmacia) with a 
modified polylinker; Site_l : EcoR I; Site_2 : Not I; 
UI-CF-FNO is a subtracted cDNA library derived from two 
normalized Human lung epithelial cell libraries (EN1 and 
DU1) The library was subtracted according to according to 
Bonaldo, Lennon and Soares, Genome Research, 6:791-806, 
1996. For additional information, contact: 
bento-soares@uiowa . edu 

TAG_TISSUE=Human Lung Epithelial Cell Lines untreated LPS 
6hr to LPS 24h 
TAG_LIB=UI-CF-FNO 
TAG SEQ=CTGCTCAGGT" 



ORIGIN 



Query Match 24.8%; Score 779.8; DB 6; Length 797; 

Best Local Similarity 99.4%; Pred. No. 7e-195; 

Matches 781; Conservative 0; Mismatches 5; Indels 0; Gaps 0; 



Qy 2358 GACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGT 2417 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 797 GACAACAACTGCNTAGGCACTGAGGTAGCTTAAACTNTAGGCACAGGCCGGGGCTGCGGT 738 



Qy 

Db 



2418 
737 



GCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCTGACTAGGATGACAGCA 2477 

I I I I I I I I I II I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCAGGCACCCGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCTGANTAGGATGACAGCA 678 



Qy 2478 GC ACAAAAGAC CAC CTTTCTCCCCT GAGAGGAGCTT CT GCT ACT CT GCAT C ACT GAT GAC 2537 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 677 GCACAAAAGAC CAC CTTT CTC C CCT GAGAGGAG CTT CT G CT ACT CT GCAT C ACT GAT GAC 618 

Qy 2538 ACTCAGCAGGGTGAT GCACAGCAGT CTGCCT CC C CT AT GGGACT C C CTT CT AC C AAGCAC 2597 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 617 ACTCAGCAGGGT GATGCACAGCAGT CT GCCT CCC CT ATGGGACTC CCTT CTAC CAAGCAC 558 

Qy 2598 AT GAGCT CT CTAACAGGGT GGGGGCTAC CCC CAGAC CT GCT CCT AC ACT GAT AT T GAAGA 2657 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I 
Db 557 AT GAGCT CTCTAACAGGGT GGGGGCTAC CCCCAGACCT GCT CCT AC ACT GAT ATT GAAGA 498 

Qy 2658 AC CTGGAGAGGAT C CTT CAGTT CT GGCCATT CC AGGGAC CCT C CAGAAAC AC AGT GT T T C 2717 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 497 ACCTGGAGAGGATC CTTCAGTT CTGGC CATT CC AGGGAC CCT C CAGAAACAC AGT GTTT C 438 

Qy 2718 AAGAGAC CCTAAAAAACCT GC CT GT CC C AGGAC C CT AT GGTAAT GAAC ACCAAACAT CT A 2777 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 437 AAGAGACCCTAAAAAACCT GCCTGT CCT AGGAC C CT ATGGT AAT GAACACCAAACAT CT A 378 

Qy 2778 AACAAT CAT ATGCTAACAT GC CACT CCT GGAAACTC C ACT CT GAAGCT GC C GCT TT G GAC 2837 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 377 AACAAT CAT AT GCTAACAT GC CACT CCT GGAAACTCC ACT CT GAAGCT GC C GCTTT G GAC 318 

Qy 2838 ACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCA 2897 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 317 ACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCA 258 

Qy 2898 GTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCT 2957 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 257 GTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCT 198 

Qy 2958 TCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCC 3017 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 197 TCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCC 138 

Qy 3018 TTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTT 3077 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 137 TTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTT 78 

Qy 3078 TGGGATTCAGAAAACT GCTTGT CAGAGACT GTTT ATTTT TT ATTAAAAAT ATAAGGCTT A 3137 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I 
Db 77 TGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTATTAAAAATATAAGGCTTA 18 

Qy 3138 AAAAAA 3143 

I I I I I I 

Db 17 AAAAAA 12 



Search completed: February 15, 2005, 13:17:35 
Job time : 9877 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2005 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 
Run on: February 14, 2005, 22:56:12 



; Search time 9798 Seconds 
(without alignments) 
12210.247 Million cell updates/sec 



Title: 

Perfect score: 
Sequence : 



US-10-015-391A-276 
3143 

1 gggctgaggcactgagagac aaatataaggcttaaaaaaa 3143 



Scoring table: IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 

Searched: 34239544 seqs, 19032134700 residues 

Total number of hits satisfying chosen parameters: 68479088 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 

Listing first 1500 summaries 



Database 



EST: 



1: 


gb_ 


_estl:* 


2: 


gb 


est2 : * 


3: 


gb_ 


~htc: + 


4: 


gb 


_est3: * 


5: 


gb 


_est4 : * 


6 


gb 


est5 : * 


7 


gb_ 


_est6:* 


8 


gb_ 


gssl : * 


9 


- gb 


gss2 : * 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 



SUMMARIES 



Result 



% 

Query 



No. 


Score 


Match 


Length 


DB 


ID 


Descript 


1 


3005 


95.6 


3005 


3 


CR623694 


CR623694 


2 


2927.6 


93.1 


3151 


3 


HSM807023 


BX640891 


3 


1874 


59.6 


2172 


9 


AY402621 


AY402621 


4 


1765.4 


56.2 


2133 


9 


AY402622 


AY402622 


5 


1747.4 


55.6 


3206 


3 


AK077976 


AK077976 


6 


1701.4 


54.1 


3086 


3 


AK035918 


AK035918 


7 


1372.2 


43.7 


2172 


9 


AY402623 


AY402623 


8 


950.6 


30.2 


1108 


5 


BX367242 


BX367242 



full-leng 
Homo sapi 
Homo sapi 
Pan trogl 
Mus muscu 
Mus muscu 
Mus muscu 
BX367242 



c 


9 


926 . 2 


29 . 


r- 

b 


1064 


5 


BX363 /41 


nv OCOT >l 1 

BX3b3 /41 


DAODO 1 H. 1 


c 


10 


874 . 4 


27 . 


8 


922 


b 


BX350bUb 


BX 3 b U b U o 


BXobUbUb 




11 


849 . 2 


O *7 

27 . 


0 


C\ O A 

934 


b 


BX3o49bo 


da oo4ybb 


DAoo4 y bb 




12 


839 


26 . 


1 


897 


b 


BX32o2bb 


t3 V o o o o c c 

BX32o2bb 


nv QOCORR 




13 


827 . 4 


26 . 


3 


974 


b 


BQOb /192 


BQUb / 19z 


AOhiW UOU HI 




14 


820 . 4 


26 . 


1 


944 


5 


BX390196 


BX390196 


BX3 9U19b 


c 


15 


779 . 8 


24 . 


8 


797 


6 


CB243787 


/"•DO /) 0*7C7 

CB243 / o / 


T T T f~* TP "CTM H 
UI — — £ JNU 




16 


775 


24 . 


7 


801 


5 


BX112994 


BX112994 


qv1 1 OQQ/1 

bxi izy y 4 




17 


769. 8 


24 . 


5 


912 


5 


n ^ /"\ T ^ 

BQ883972 


BQo 83972 


AGENCOURT 




18 


768 


24 . 


4 


958 


5 


BX376660 




nv Qicccn 
dXj / bbbU 




19 


757.6 


24 . 


1 


892 


6 


CD107028 


CD107028 


AGENCOURT 


c 


20 


756.2 


24 . 


1 


819 


6 


CD631371 


CD631371 


b6ub042 /H 




21 


748 . 6 


23 . 


8 


951 


5 


BQ056228 


BQ056228 


AGENCOURT 




22 


696.6 


22 . 


2 


775 


1 


AU122156 


AU122156 


AU122156 




23 


691.2 


22 . 


0 


970 


5 


BQ707628 


BQ707628 


AGENCOURT 




24 


681 


21. 


7 


1066 


4 


BM806752 


BM806752 


AGENCOURT 


c 


25 


675.2 


21 . 


5 


763 


6 


CD631373 


CD631373 


56066030H 




26 


674 


21 . 


4 


727 


7 


CN255817 


CN25581 / 


1 Tnnn ^ oco 

1 /U0042b2 




27 


673 


21. 


4 


960 


5 


BX367243 


BX367243 


BX367243 




28 


666 


21. 


2 


706 


6 


CD631372 


CD631372 


56050427 J 




29 


664 


21. 


1 


681 


7 


CV023527 


CV023527 


i A A -i— » n T 

490 Full 




30 


661. 8 


21. 


1 


666 


4 


BG684636 


BG684636 


602635914 




31 


650 


20 . 


7 


925 


5 


BQ937439 


•d/"\ooo >i o n 

BQ937439 


AGENCOURT 


c 


32 


627 . 4 


20. 


0 


640 


6 


CA311774 


CA3 11774 


UI-CF-FN0 


c 


33 


612 


19. 


5 


624 


4 


BM666780 


BM666780 


UI-E-CLl- 




34 


609. 8 


19. 


4 


1119 


4 


BI550650 


BI550650 


603195823 




35 


608 . 4 


19 . 


4 


803 


7 


CN539797 


CN539797 


UI-M-HUU- 




36 


598.6 


19. 


0 


621 


2 


AW965845 


AW965845 


EST377918 


c 


37 


598.4 


19. 


0 


634 


5 


BU632880 


BU632880 


UI-H-FE1- 


c 


38 


594 


18. 


9 


618 


5 


BU686374 


BU686374 


TTT /"^ T~» T\TT1 

UI-CF-DU1 




39 


590. 8 


18 . 


8 


740 


6 


CD631374 


CD631374 


c s~ r\ /~ <~ r\ ^ r\ t 

56066030 J 




40 


585.2 


18 . 


6 


881 


5 


BQ960065 


BQ960065 


AGENCOURT 




41 


579 . 2 


18 . 


4 


720 


6 


CA315771 


CA3 15771 


TIT if r .11 ,T f\ 

UI-M-FWU- 




42 


579 


18 . 


4 


580 


5 


BP346261 


BP346261 


BP34 6261 




43 


576.2 


18. 


3 


582 


5 


BP312448 


BP312448 


^■OOI O A AO 

BP312448 




44 


568 . 6 


18. 


1 


783 


7 


CK483764 


CK483764 


AGENCOURT 




45 


566. 8 


18 . 


0 


582 


5 


BP305311 


BP305311 


BP305311 




46 


565. 8 


18. 


0 


571 


7 


CR554650 


CRbb46bO 


DKFZp4b90 




47 


557 . 8 


17 . 


7 


796 


5 


BU052878 


T5TTA CO OOO 

BU0b2o /o 


UI-M-FCU- 




48 


554 . 4 


17 . 


6 


718 


7 


CK837783 


T^" o o o o o o 

CKoj / / oj 


4UbJU44 d 




49 


552 . 6 


17 . 


6 


917 


6 


CA454892 


/-«7\ /I r /( o A A 

C A4 b 4 o 9 z 


t\ tt* xt t n ti 
AGhN OOUKl 




50 


552 . 4 


17 . 


6 


779 


4 


BI683 /2 / 


Bl boo 1 Z. 1 


bUooUbzo / 




51 


551.4 


17 . 


5 


695 


4 


BG685741 


BG685 / 41 


6U263 /bio 




52 


547 


17 . 


4 


547 


4 


i-i-w 1 ^ O i*- C 1 

BM128651 


BM1286bl 


irl4D(J9 . y 




53 


546. 6 


17 . 


4 


709 


5 


BQ573544 


BQb /3b44 


TTT TV if T7>TN f\ 

U1~M— r UU— 




54 


542 . 6 


17 . 


3 


667 


4 


BG703963 


BG / 03963 


bU2 bo / Ubl 




55 


542.2 


17 . 


3 


784 


5 


BQ043061 


BQ043061 


UI-M-EGOp 




56 


538 . 6 


17 . 


1 


841 


6 


CB566426 


r'uccc/i oc 

CBbob4Zb 


7\ / r *TP'KT/^'OTTT3 r P 

AGrjNCUUKl 




57 


530 


16. 


9 


550 


5 


BP292524 


BP292b24 


BPz yzoz4 




58 


528 


16. 


8 


528 


6 


CA393520 


CA393520 


cs39bU3 . y 




59 


526.2 


16. 


7 


944 


4 


BI250501 


BIzbUbOl 


bUZ y yobol 




60 


524 . 4 


16 . 


7 


858 


7 


CK022938 




AGhiN LUUK1 


c 


61 


522.4 


16. 


6 


536 


5 


BQ356019 


BQ356019 


PM3-HT130 




62 


510.8 


16. 


3 


793 


4 


BI146386 


BI146386 


602910749 




63 


510 


16. 


2 


666 


2 


BE868099 


BE868099 


601443414 




64 


507.8 


16. 


2 


519 


7 


CK819350 


CK819350 


ifl4b09.y 




65 


500.2 


15. 


9 


532 


4 


BM691378 


BM691378 


UI-E-CI1- 





cc 

DO 


DUU.Z 


1 R 
ID . 


y 


/Do 


A 

4 


Dl IUjoUI 


c 


b / 


4 y o 


10 . 


o 


Db / 


1 
1 


AU 14 / Olj 




DO 


4 yo . 4 


10 . 


Q 
0 


coo 
b2o 


/ 


/**\T T Q O A Q A 

L.N / y2 Uo U 




by 


4 y 4 


10 . 


"7 


oy o 


2 


DCCOO^ AO 

bb0oo4Uo 




/0 


4 o b . b 


10 . 


0 


TOO 

/bo 


/ 


r*V A 01 TTQ 

CJ\4ol / to 




""7 1 
/ 1 


/IOC 

4 o b 


10 . 


0 


Q C Q 

y by 


4 


d(j2 4 /ooy 




/2 


/I01 C 

4o 1 . b 


15 . 


3 


bo2 


/ 


P7CO cQcyi 

CKb20ob4 




/J 


A O 1 

4 o 1 


15 . 


3 


A Q 1 

4 ol 


4 


DMCO^ qqo 

BMoy 4y y2 


c 


/4 


4 / o . o 


15 . 


2 


DUO 


1 


7VT01 TAQQ 

Aim /uyy 




/5 


4 / o . o 


15 . 


2 


o 10 


b 


CdOo /2o4 




76 


476.8 


15 . 


2 


544 


4 


BI481oo / 




77 


/in rv * 

470.4 


15 . 


0 


con 
530 


1 


AA4 o 124 6 


c 


/o 


A C O O 

469 . 2 


1 A 

14 . 


y 


c a o 
Ob2 


2 


7VTJQ O C /I O Q 

AWo Jb42y 




79 


467 . 8 


1 A 

14 . 


y 


821 


5 


BQ44269 6 




o a 

80 


465.4 


1 A 

14 . 


o 
O 


806 


/ 


CK4ol /4b 




81 


464.6 


14 . 


8 


roc- 
bob 


4 


BI35yo /l 




82 


462 . 6 


14 . 


1 


f~ /Z 

66 / 


2 


AWy 14 963 




83 


462 . 2 


1 A 

14 . 


—i 
1 


o o n 

88 7 


4 


nrOI AATA 

BI219079 




84 


461 . 4 


14 . 


1 


672 


6 


T5V7 A TCAC 

BY747595 




85 


461 . 2 


14 . 


7 


892 


5 


DAflO >t OAA 

BQ934892 




86 


449.6 


14 . 


3 


537 


2 


AW657913 




87 


* /IT 

447 


1 A 

14 . 


2 


8 /2 


4 


"DXT CAOAA 

BI150290 


c 


o o 

OO 


A A C A 

446.4 


1 A 

14 . 


2 


40U 


1 


A10bo2UU 




89 


A Jl yl 

444 


1 A 

14 . 


1 


o o o 

822 


7 


C05653 /2 




90 


443 . 8 


14 . 


1 


659 


6 


BY747925 


c 


91 


443.4 


14 . 


1 


456 


5 


BU726485 


c 


92 


A A A /I 

442 . 4 


1 A 

14 . 


1 


AAA 

444 


5 


BQ356020 


c 


93 


440.6 


14 . 


0 


a f a 

468 


5 


BQ356018 




94 


439.6 


14 . 


0 


578 


4 


BI341318 


c 


95 


436.8 


13 . 


9 


440 


1 


AA9 /3640 




96 


435 . 2 


13 . 


8 


C "~l A 

579 


4 


BI360284 




97 


432.4 


13 . 


8 


621 


9 


CG5912 58 




98 


431 


13 . 


7 


632 


/ 


C05o 1119 




99 


430 . 8 


13 . 


7 


794 


2 


BF578994 




100 


427 


13 . 


6 


563 


4 


BM030859 


c 


101 


A C Q 

426. o 


13 . 


6 


A A T 

441 


1 


AA5 54 541 




102 


426.8 


13 . 


6 


O O "~l 

82 / 


/ 


r*r\ A A A O 1 A 

C04 U4olU 




103 


425.2 


1 sJ . 


0 


/ ^o 

44o 


2 


or oo2bl2 


c 


i a vi 
104 


420 . 2 


1 J . 


0 


40 / 


1 


ATOQ1 1 1 A 
A12y 111U 




n a c 
105 


422 . o 




5 


546 


2 


Brl9yo0o 




n a c 

106 


422 . 4 


1 o 

13 . 


4 


/59 


4 


BG24o / by 




107 


418.4 


13 . 


3 


r n r 

5/6 


4 


BI345boO 


c 


108 


Aid 

415 


13 . 


2 


A 1 C 

415 


1 


AI01 /2o0 




i nn 
109 


A 1 C 

415 


13 . 


2 


[- o <c 
OOD 


2 


t-> tp n AAOTO 

Br iyy o lo 


c 


"1 1 A 
110 


A "\ A C 

414.6 


1 J . 


2 


/I C /I 

404 


2 


Br oozoll 




Til 
111 


y| 1 A a 
4 14 . b 


1 J . 


2 


CL "3 Q 
JOO 


2 


Br UoUUlo 


c 


112 


A 1 O C 




2 


DO / 


c 
O 


BXo /29 4o 




llo 


4 lo 


lo . 


1 


Ooo 


0 


Br o 100 / o 


c 


114 


412 . b 


lo . 


1 


4bo 


/ 


i o4o /y 




TIC 

115 


A 1 O 

412 


1 J . 


1 


0o2 


0 


nnQI A 1 QC 

Brol4 iy b 




1 1 c 

lib 


yii i 
411 


lo . 


1 


Ool 


0 


Brol4 oyo 




117 


410.8 


13 . 


1 


624 


4 


BM691301 




118 


409 


13. 


0 


582 


5 


BP312657 




119 


409 


13. 


0 


721 


2 


BF580373 




120 


408 


13. 


0 


473 


7 


H08023 




121 


406 


12. 


9 


406 


7 


CR538178 




122 


405 


12. 


9 


583 


5 


BP314892 



BI105301 602893591 
AU147813 AU147813 
CN792080 4126901 B 
BE588408 194035 BA 
CK481778 AGENCOURT 
BG247839 602359548 
CK625364 mi32c08.y 
BM694992 UI-E-CL1- 
AI817099 wj76hll.x 
CB587284 AGENCOURT 
BI481387 H2RPE-174 
AA481246 aa34hll.r 
AW836429 PM3-LT003 
BQ442696 UI-M-EVO- 
CK48174 6 AGENCOURT 
BI359871 384615 MA 
AW914963 EST346267 
BI219079 602938695 
BY747595 BY747595 
BQ934892 AGENCOURT 
AW657913 93554 MAR 
BI150290 602915311 
AI568200 tn66h01.x 
C0565372 AGENCOURT 
BY747925 BY747925 
BU726485 UI-E-CI1- 
BQ356020 PM3-HT130 
BQ356018 PM3-HT130 
BI341318 368709 MA 
AA973640 oo48c04.s 
BI360284 387146 MA 
CG591258 OST245642 
C0581119 ILLUMIGEN 
BF578994 602096109 
BM030859 495387 MA 
AA554541 nll4b01.s 
CO404310 AGENCOURT 
BF882612 QV3-ET020 
AI291110 qml0d09.x 
BF199358 249500 MA 
BG243769 602357081 
BI345630 374508 MA 
AI017230 ou32dl2.x 
BF199378 249524 MA 
BF882611 QV3-ET020 
BF080018 230753 MA 
BX372943 BX372943 
BP315573 BP315573 
T34379 EST66750 Hu 
BP314196 BP314196 
BP314893 BP314893 
BM691301 UI-E-CI1- 
BP312657 BP312657 
BF580373 602097124 
H08023 yl91d06.rl 
CR538178 DKFZp459F 
BP314892 BP314892 





123 


404 . 8 


12 . 


9 


870 


2 


BE306403 




124 


404.6 


12 . 


9 


610 


4 


t"» s~ -i o T o r\ 

BG618720 




125 


403.2 


12 . 


8 


1122 


2 


BF159534 


c 


126 


402.6 


12. 


8 


449 


1 


AI623385 




127 


401 . 4 


12 . 


8 


581 


5 


BP357544 




128 


395. 4 


12. 


6 


634 


1 


AA646591 




129 


394. 8 


12. 


6 


494 


4 


BM288077 




130 


392 . 4 


12 . 


5 


766 


7 


CK478839 




131 


392.2 


12 . 


5 


882 


2 


BE571537 




132 


392 


12. 


5 


582 


5 


BP315572 




133 


391.6 


12. 


5 


555 


6 


CB613565 




134 


390.6 


12. 


4 


581 


6 


CB606887 




135 


388 . 8 


12 . 


4 


465 


2 


BF882607 




136 


388 


12. 


3 


618 


6 


CB579294 




137 


387 . 4 


12 . 


3 


544 


4 


BI961174 


c 


138 


387 


12. 


3 


405 


1 


AI221749 




139 


383 


12. 


2 


713 


6 


BY763638 


c 


140 


380. 8 


12 . 


1 


412 


1 


AA761091 




141 


378 


12. 


0 


598 


1 


AV617761 




142 


377 . 4 


12 . 


0 


535 


5 


BQ552175 




143 


377 .2 


12. 


0 


665 


4 


BI151295 


c 


144 


374.4 


11. 


9 


459 


2 


BF154829 


c 


145 


374 . 4 


11. 


9 


459 


4 


BG949399 




146 


372.4 


11. 


8 


582 


5 


BP314933 




147 


370. 6 


11. 


8 


600 


6 


CA530364 




148 


370.2 


11. 


8 


541 


2 


AW654459 


c 


149 


369.4 


11. 


8 


464 


5 


BQ356179 




150 


367 . 4 


11. 


7 


490 


2 


AW659681 




151 


367 


11. 


7 


516 


2 


BF075002 


c 


152 


366.4 


11. 


7 


369 


2 


AW593031 




153 


363.8 


11. 


6 


368 


1 


AA419534 




154 


363.4 


11. 


6 


513 


4 


BM106299 




155 


360. 6 


11. 


5 


742 


6 


CB249229 




156 


356. 4 


11. 


3 


583 


5 


BP357148 




157 


355 


11. 


3 


529 


5 


BU698229 


c 


158 


354.4 


11. 


3 


363 


1 


AI221756 




159 


353 


11 . 


2 


576 


4 


BI914790 


c 


160 


351.4 


11. 


2 


737 


7 


C0425778 




161 


348 


11. 


1 


360 


7 


T19441 


c 


162 


346 


11. 


0 


358 


1 


AI682007 




163 


344 . 8 


11. 


0 


502 


5 


BU696522 




164 


344 .2 


11. 


0 


623 


2 


BB628588 




165 


343.6 


10. 


9 


424 


2 


AW352877 




166 


340.4 


10. 


8 


552 


2 


AW655294 




167 


338 . 6 


10. 


8 


449 


5 


BQ336149 




168 


337 . 2 


10. 


7 


545 


2 


AW654538 




169 


334 . 8 


10 . 


7 


479 


4 


BM088355 




170 


333 . 2 


10 . 


6 


411 


2 


BE859656 




171 


332 .2 


10 . 


6 


443 


2 


AW355069 




172 


327. 4 


10 . 


4 


700 


5 


BM944176 


c 


173 


326. 8 


10. 


4 


330 


7 


CK819349 




174 


321.8 


10. 


2 


469 


1 


AJ650325 




175 


321.2 


10. 


2 


445 


2 


AW481698 




176 


320.6 


10. 


2 


433 


2 


AW355070 




177 


318.6 


10. 


1 


390 


6 


CB778065 




178 


318.4 


10. 


1 


432 


2 


BF019645 


c 


179 


316.8 


10. 


1 


353 


2 


AW628784 



BE306403 60H02295 
BG618720 602645175 
BF159534 601769029 
AI623385 tsl8g03.x 
BP357544 BP357544 
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603386049 


1403 


49.4 


1. 


6 


910 


9 


CNS033DR 


AL226008 


Tetraodon 


1404 


49.2 


1. 


6 


542 


4 


BM740534 


BM740534 


K-EST0011 


1405 


49.2 


1. 


6 


544 


4 


BM766233 


BM766233 


K-EST0048 


1406 


49.2 


1. 


6 


626 


4 


BM740685 


BM740685 


K-EST0012 


cl407 


49.2 


1. 


6 


897 


9 


CG766342 


CG766342 


TcB4 8.4_B 


cl408 


49.2 


1. 


6 


898 


9 


CG770102 


CG770102 


TcB51.2_A 


cl409 


49.2 


1. 


6 


901 


5 


BQ433090 


BQ433090 


AGENCOURT 


1410 


49.2 


1. 


6 


904 


5 


BQ735037 


BQ735037 


AGENCOURT 


1411 


49.2 


1. 


6 


1177 


5 


BM906470 . 


BM906470 


AGENCOURT 


1412 


49.2 


1. 


6 


1309 


5 


BU541920 


BU541920 


AGENCOURT 


C1413 


49 


1. 


6 


293 


6 


CD631363 


CD631363 


56027739H 


cl414 


49 


1. 


6 


695 


7 


CK225361 


CK225361 


704197850 


1415 


49 


1. 


6 


1161 


3 


CR679362 


CR679362 


Tetraodon 


cl416 


48.8 


1. 


6 


372 


1 


AA984436 


AA984436 


am86d04 .s 


1417 


48.8 


1. 


6 


412 


6 


CB801382 


CB801382 


AMGNNUC : M 


1418 


48.8 


1. 


6 


473 


8 


AQ603447 


AQ603447 


HS_2126_A 


1419 


48.8 


1. 


6 


610 


2 


BB613257 


BB613257 


BB613257 


1420 


48.8 


1. 


6 


726 


7 


CN042616 


CN042616 


vll p43 g 


1421 


48.6 


1. 


5 


431 


6 


CB757701 


CB757701 


AMGNNUC : M 


1422 


48.6 


1. 


5 


702 


4 


BI771035 


BI771035 


603055382 


1423 


48.6 


1. 


5 


1809 


3 


AK051165 


AK051165 


Mus muscu 


1424 


48.6 


1. 


5 


3317 


3 


AK052671 


AK052671 


Mus muscu 


1425 


48.6 


1. 


5 


3672 


3 


AK028900 


AK028900 


Mus muscu 


1426 


48.6 


1. 


5 


4248 


3 


AK031704 


AK031704 


Mus muscu 


1427 


48.4 


1. 


5 


416 


5 


BY224521 


BY224521 


BY224521 


1428 


48.4 


1. 


5 


539 


1 


AL918018 


AL918018 


AL918018 


1429 


48.2 


1. 


5 


428 


6 


CB794320 


CB794320 


AMGNNUC : N 


1430 


48.2 


1. 


5 


640 


6 


CA334086 


CA334086 


NISC ls05 


1431 


48.2 


1. 


5 


876 


6 


CA489866 


CA489866 


AGENCOURT 


1432 


48 


1. 


5 


384 


6 


CB703233 


CB703233 


AMGNNUC : N 


1433 


48 


1. 


5 


569 


4 


BI775284 


BI775284 


467707 MA 



1434 


48 


1 . 5 


817 


7 


CF994909 


l.c y y4 y uy 


7\ f~* TlkT^/^vT T T> r P 

AbhiiN LUUK1 


cl435 


48 


1 . 5 


963 


5 


BX341410 


BXJ4 14 10 




1436 


47 . 8 


1 . 5 


253 


4 


BF988853 


OPQOOOCO 

DC 9ob ODO 


TT C /^xi A1 T 


1437 


47 . 8 


1 . 5 


254 


4 


r>-»*ft O AT A C 

BM030705 


DMA OOTrtC 

BM0 JO /Oo 


/IQCI Q C TUT A 

4yoioo MA 


1438 


47 . 8 


1 . 5 


406 


6 


r* t"i ft ft ft ft c i 

CB808351 


PDO("\OOC1 

LdoUojDI 


7V TVJT/^XTXTT If* * C? 

AMCjNNUC : o 


cl439 


47 . 8 


1. 5 


420 


2 


t» *vt ft ft ft ft c ft 

AW803853 


7\ r.7 o r\ o o c o 

AW803853 


T T O TTTv/ZAAQ 

ILz-UMUUo 


cl440 


47. 8 


1.5 


537 


6 


CB717637 


CB717637 


AMGNNUC : U 


1441 


47. 8 


1 . 5 


633 


7 


CN295126 


CN2y512o 


1 / UUUDoZD 


1442 


47.8 


1.5 


975 


2 


BF101157 


BF101157 


ft -i r /I ""j ft ft 

601754732 


1443 


47 . 6 


1.5 


619 


4 


BI648895 


BI648895 


603275856 


1444 


47.6 


1.5 


709 


6 


CD348531 


CD348531 


UI-M- FY0- 


1445 


47.6 


1.5 


777 


5 


BU708565 


BU708565 


UI-M-FI0- 


cl446 


47. 6 


1 . 5 


796 


1 


AL561140 


7VT C^l 1 yl rs 

AL561140 


7VT C£1 i /in 


1447 


47. 6 


1.5 


1911 


9 


AY403382 


AY4 03382 


Mus muscu 


cl448 


47 . 4 


1.5 


240 


4 


BI000873 


BI000873 


MR3-HN006 


cl449 


47.4 


1.5 


469 


1 


AA859662 


AA859662 


UI-R-EO-b 


1450 


47.4 


1.5 


613 


5 


BX271575 


BX271575 


BX271575 


1451 


47.2 


1 . 5 


645 


4 


BI066459 


BI066459 


pgf In .pkO 


1452 


47.2 


1.5 


654 


2 


BB037994 


BB037994 


l^T^ftft^lftft A 

BB037994 


cl453 


47.2 


1.5 


737 


9 


CR018931 


/^T^ftl ftftOt 

CR018931 


Reverse s 


1454 


47.2 


1 . 5 


775 


5 


BU703431 


BU703431 


UI-M-FO0- 


1455 


47.2 


1.5 


1023 


6 


CD245257 


CD245257 


AG EN COURT 


cl456 


47 


1 . 5 


367 


5 


BQ320183 


t% ^ ft ft -n ft ft 

BQ320183 


PM4-CT082 


1457 


47 


1.5 


480 


7 


CR579310 


CR579310 


s*» r\ c >~t ft ft -1 ft 

CR579310 


1458 


47 


1 . 5 


511 


4 


BI673056 


BI673056 


_c ^_ ft ft ft 
f t33e03 . y 


1459 


47 


1.5 


516 


6 


CD619061 


CD619061 


ryftrftft a /""tt 

56053346H 


1460 


47 


1.5 


543 


1 


AA940432 


AA940432 


vz48h07 . r 


1461 


47 


1 . 5 


625 


4 


T-» -w- > — 1 1 — A r\ A 

BI753404 


BI753404 


/~ftftftft/~C ftft 

603026593 


1462 


47 


1.5 


834 


7 


CF149484 


CF149484 


AG EN COURT 


1463 


46.8 


1.5 


350 


5 


BY200122 


BY200122 


BY200122 


1464 


46.8 


1.5 


365 


2 


AW437778 


AW437778 


79230 MAR 


1465 


46.8 


1.5 


635 


1 


AL852575 


AL852575 


t«t ft r" ft f~ i r~ 

AL852575 


cl466 


46.8 


1 . 5 


741 


2 


BF232471 


T-« T— 1 ft ft ft il ""7-1 

BF232471 


de06c04 . x 


1467 


46.8 


1.5 


932 


9 


CNS022IX 


AL178242 


Tetraodon 


1468 


46.8 


1.5 


950 


5 


BU175283 


■ftTT-i r~ ft ft ft 

BU175283 


AGEN COURT 


cl469 


46. 8 


1.5 


1131 


5 


BM922197 


BM922197 


AGENCOURT 


1470 


46.6 


1.5 


533 


1 


AA175711 


AA175711 


ms97a05 . r 


1471 


46.6 


1 . 5 


609 


4 


BI066327 


BI066327 


r -] . i . ft 

pgr In . pkO 


1472 


46.6 


1.5 


641 


6 


BY728676 


BY728676 


BY728676 


1473 


46.6 


1.5 


688 


4 


BG700674 


BG700674 


ftft^ftftftft/- 
602682306 


1474 


46.4 


1 . 5 


395 


6 


CB773879 


CB773879 


AMGNNUC : N 


cl475 


46.4 


1.5 


678 


9 


CC569313 


<-^*->»Cy"ftft"l ft 

CC569313 


nifA A ft J * /I 

CH24 0 44 4 


1476 


46.4 


1. 5 


957 


4 


ft j»~ 1 ft r I - 

BG261855 


n^O ^ 1 ore 

BG261855 


/-ftftftTft/7rr r 

602373655 


1477 


46.4 


1.5 


971 


4 


BG342228 


ft /I ft ft ft ft 

BG342228 


ft ft ft ""7 /i ft ft r" 

602374305 


cl478 


46.4 


1 . 5 


985 


5 


BX402983 


nv>t ft ft ft o ft 
BX402983 


r^vr>l ft ft ft Q o 

BX402983 


1479 


46.4 


1 . 5 


994 


5 


BQ929877 


nft A A ft ft —i —7 

BQ929877 


AGENCOURT 


1480 


46.2 


1 . 5 


564 


7 


r+ir f C ""7 ft ft 

CK635703 


CK63o / 03 


TTT" TUT TTXT O 

UI-M-HNO- 


1481 


46.2 


1.5 


570 


2 


T>r"»ft.*">ftft.ftft 

BE033028 


BE033028 


133242 MA 


1482 


46.2 


1.5 


590 


9 


AY420627 


TV VT /l ft ft O ^ 

AY420627 


Homo sapi 


1483 


46.2 


1. 5 


594 


7 


CN409468 


y^lkT >l ft ft /I ft 

CN409468 


1 T AAA it 

170004276 


1484 


46.2 


1 . 5 


624 


2 


AW328571 


7\ r.7 ft ft ft r T T 

AW32 85 /l 


j ^ ft ft J T ft 

dsOoalz . x 


1485 


46.2 


1 . 5 


634 


5 


BM951500 


n»/n c t r nn 

BMyolbUU 


TTT VT TP A 

U±— M-fciGU— 


1486 


46.2 


1.5 


650 


7 


CF746951 


CF746951 


UI-M-HE0- 


1487 


46.2 


1.5 


658 


7 


CN409465 


CN409465 


170005325 


1488 


46.2 


1.5 


678 


7 


CN409457 


CN409457 


170004177 


1489 


46.2 


1.5 


732 


7 


CN409463 


CN409463 


170005325 


1490 


46.2 


1.5 


732 


7 


CN531114 


CN531114 


UI-M-HO0- 



1491 


A C O 

46 . z 


1 . 


r 

5 


"~l A 1 

741 


/ 


r^TT» r 7 on/IOC 

Cr / oU4ob 






1492 


AC 1 


1 . 


b 


/ / O 


/ 




^ £ / ODOUO 


TTT — M— Hn0 — 


1493 


46 


1 . 


5 


394 


*- 

6 


CB / / 6b61 


/ / DO D _L 




cl494 


A f 

46 


1 

1 . 


5 


428 


1 


AI4boUb 6 


TIT A Rftfm^ 
/\J_ 4 JOU J J 


L J DOlllU .X 


1495 


A C 

4 6 


1 . 


b 


too 

bz o 


o 
z 


DrjOo4 U / b 






1496 


46 


1. 


5 


575 


5 


BP338720 


BP338720 


BP338720 


1497 


46 


1. 


5 


714 


7 


CR789306 


CR789306 


DKFZp4590 


1498 


46 


1. 


5 


2775 


3 


AK077021 


AK077021 


Mus muscu 


1499 


45.8 


1. 


5 


372 


2 


BF443919 


BF443919 


261588 MA 


1500 


45.8 


1. 


5 


375 


6 


CB691762 


CB691762 


AMGNNUC : M 



ALIGNMENTS 



RESULT 1 
CR623694 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 
REMARK 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 



COMMENT 



FEATURES 

source 



CR623694 3005 bp mRNA linear HTC 21-JUL-2004 

full-length cDNA clone CS0DL005YC17 of B cells (Ramos cell line) 
Cot 25-normalized of Homo sapiens (human) . 
CR623694 

CR623694.1 GI: 50504501 
HTC; CN S LT_c DNA . 
Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 3005) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished 

Contact : Feng Liang Email : fliang@lifetech.com URL : 
http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue 

2 (bases 1 to 3005) 
Genoscope . 

Direct Submission 

Submitted (20- JUL-2004 ) Genoscope - Centre National de Sequencage : 
BP 191 91006 EVRY cedex - FRANCE (E-mail : seqref@genoscope.cns.fr 
- Web : www.genoscope.cns.fr) 

1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. 

Location/Qualifiers 

1. .3005 

/organism="Homo sapiens" 
/mol_type="mRNA" 



/db_xref =" taxon : 9606" 
/clone="CS0DL005YC17" 
/tissue_type="B cells 
/plasmid="pCMVSP0RT_6' 



(Ramos cell line) Cot 25-normalized" 



ORIGIN 



Query Match 95.6%; Score 3005; DB 3; Length 3005; 

Best Local Similarity 100.0%; Pred. No. 0; 



Matches 3005; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



Qy 


99 


CTGAGCATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTC 


158 




i i i i i i i i i i i i i i i i i i i i i i i i t i i i i i l l l l 1 1 1 1 1 1 1 1 1 1 1 l 1 1 1 1 1 1 1 1 1 t 1 I 1 1 
1 II 1 1 1 1 1 1 11 1 1 11 II 1 M 1 II II II II 1 1 1 II 1 II ! 1 II 1 1 1 1 1 M 1 II M 1 1 1 1 1 1 1 




Db 


1 


CTGAGCATGGCCCTCCCAGCCCTGGGCU 1 UGAUUUL. 1 UUAijUU 1 tt 1 UUUUU llli^L-n- 


fin 


Qy 


159 


TTCCAACTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCC 


218 




i i i i i i i i i i t i i i i i i t i i i i i i i i t i I I t I l i l i 1 1 1 

1 1 1 1 1 1 1 11 11 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M (1 1 1 1 1 1 1 1 1 1 1 1 




Db 


61 


TTCCAACTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGUACjUCj^ 


i on 


Qy 


219 


AT GCCCAGGGT CAGAT ACT ATGCAGGGGAT GAAC GT AGGGCACTT AGCTT CT T CCACCAG 


278 




1 1 1 ) 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 I f 1 1 i 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 t 1 1 1 1 1 

1 1 1 II 1 1 1 II 1 II 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 I 1 1 II 1 1 1 1 1 1 1 1 1 1 M 1 ! 1 1 1 1 1 M 




Db 


121 


ATGCCCAGGGTCAGATACTATGCAGGGGATGAACG 1 AGGGUAU 1 1 Abu Hull LLALLAb 


i rd 
iou 


Qy 


279 


AAGGGCCTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTG 


338 




■ i i i i i i i i i i i i i i i i i i i i i i i i i t i i t i i i t i i i i i i i i i i i i i i i i i t i i i i i i i i 
1 1 II II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 II 1 II 1 1 1 II II 1 1 1 1 1 1 1 1 1 I M 1 1 1 1 1 1 1 




Db 


181 


AAGGGCCTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGA1GGAAA1AU1 Ul UlAUul U 


9 a n 

^ ft u 


Qy 


339 


GGGGCTCGAGAAGCCATTCTGGCCTTGGATATCCAGGATCCAGGGGTCCCCAGGCTAAAG 


398 




• ■ i i ■ ■ i ■■ i i i i i i i t i i i i i i i i i i i i i i i i i < i i i i i i i i i i i > i i t i i i i i i i i i i 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


241 


GGGGCT C GAGAAGCCATT CT GGCCTT GGATAT C C AGGATC C AGGGGT CC C C AGGCTAAAG 


oUU 


Qy 


399 


AACATGAT AC C GT GGCCAGCCAGT GAC AGAAAAAAGAGTGAAT GT GC CTTTAAGAAGAAG 


458 




i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i t i i i i i i i i i i i i i i i 
II II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II II II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 




Db 


301 


AACAT GAT ACCGT GGCCAGCCAGT GACAGAAAAAAGAGT GAAT GT GCCTTTAAGAAGAAb 


^ £ n 


Qy 


459 


AGCAATGAGACACAGT GTTT CAACT TCAT CC GT GT C CT GGT T T CT TACAAT GT CAC CC AT 


518 




■ i i i i i i i i i i i i i i i i i i i i i t i i i i i i i i i i i i i i i i i i t i i i i i i i i i i > i i i i i i i 
1 1 1 I 1 II 1 1 II 1 1 1 II 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 II II 1 1 1 1 II 1 1 1 1 I 1 1 1 1 1 1 1 




Db 


361 


AGCAAT GAGAC AC AGT GTT T CAACTT C AT CC GT GT C CT GGT TT C T TACAAT GT CAC CC AT 


a o n 
4 Z U 


Qy 


519 


CTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGAT 


578 




i i i i i i i i i i i i i i i i i i i i i i i i i t i i i i i i t i i i i i i i t i i i i i i i > i i i i i i i i i i i 
1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


421 


CTCTACACCTGCGGCACCTTCGCCTTCAGCLL1 GUI IblALLi 1UA1 lb-AAUl 1UAAUA1 


a p n 

ft o u 


Qy 


579 


TCCTACCTGTTGCCCATCTCGGAGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTT 


638 




i i i i i i i i i < i i i i i i t i i i i i i t i i > i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i t i 
1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


481 


TCCTACCTGTTGCCCATCTCGGAGGACAAGGlCAlUbAUUUAAAAUUUUAAAUU 1 1 


S4 n 

D ft U 


Qy 


639 


GACCCCGCTCACAAGCATACGGCTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATG 


698 




i i i i i i i i i i i i i i i > i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i I I I I I I 
1 1 1 1 II II II 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 M 1 1 1 1 1 1 




Db 


541 


GACCCCGCTCACAAGCATACGGCi G1C1 1GG1 bUAl bbbAlbLlLlAl iLlbbiALi/ii u 


finn 


Qy 


699 


AACAACTTCCTGGGCAGTGAGCCCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTC 


758 




i i i i > i i i < i t i i i i i i t i i i i i i i i i i i i i i i i i i i i i i i i i i I t t t I I 1 l 1 l l 1 1 1 1 1 
I | 1 1 1 1 1 1 1 1 1 II II 1 1 It 1 II 1 1 1 1 1 II 1 1 1 1 II II II 1 II 1 1 II 1 1 1 1 II 1 1 1 1 II 1 I 




Db 


601 


AACAACTTCCTGGGCAG1 GAGUUUA1 CL 1 b-Ai b-UtaUAUAU 1 bbbAl UUUAUUU 1 bl uu l u 




Qy 


759 


AAGACCGACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCT 


818 




i i i i i i i i t i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i I i I I I I I I I I I I I t 1 1 1 1 
11 1 II 1 1 1 II II 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 M II 1 1 11 




Db 


661 


AAGACCGACAAC1 rCCiUCGUlGGUlGUAlUAlUAUUUUlUUl 1 1 bl bbbAbvvLAi bbbi 


7?n 


Qy 


819 


TCGACCCAGGTCGTCTACTTCTTCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAG 


878 






1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 




Db 


721 


TCGACCCAGGTCGTCTACTTCTTCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAG 


780 


Qy 


879 


AGGCTCCACACATCGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTG 


938 






I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


781 


AGGCTCCAC ACAT CGCGGGT GGCT AGAGT CT GCAAGAATGAC GT GGGCGGC GAAAAGCT G 


840 



Qy 


939 


CTGCAGAAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAG 


998 




1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


o4 1 


L 1 \j L AG AAG AAG 1 bbnL/tnLU 1 X \->\^ 1 brin.bb^L^/\b^ 1 br\-» ± ^ ± vjb*r\v^v^^/Vjv^ wovjvjvj^jn\j 


900 


Qy 


999 


CTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCC 


1058 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


9U1 


r'rnrrTTTprnr* a a rr-rvr* a Trrrrp a err* rrTPfTrrT rfTP^rrrz ZiTTPT PP PAP APPTP PC 
LI GLLL1 1 LAALb 1 LAI LLGLLALGLGG1 LL1 bbl bLbbbbbbAJ. 1^1 ^v^v^^-iv«./-vo^x v^v^v„> 


960 


Qy 


1059 


CACATCTACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTT 


1118 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


961 


CACATCTACGCAG1 CI I CALL 1 LLLAb 1 bbLAbb 1 1 GGLGGGALLAGGAGL1 LI Vjv^vjVjJ. 1 


1020 


Qy 


1119 


TGT GC CTT CT CTCT CT T GGACATT GAAC GT GT CTT T AAGGGGAAAT ACAAAGAGTTGAAC 


1178 




I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1021 


TGTGCCTTCTCTCTCTTGGACA1 IGAALG1G1L1 1 1 AAbbbbAAAI ALAAAbAb 1 1 LAAL 


i nan 

J. VJ O \J 


Qy 


1179 


AAAGAAACTT CAC GCT GGACT ACTT AT AGGGGCC CT GAGAC CAACC C C C GGC C AGGC AGT 


1238 




M 1 II 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 




Db 


1081 


AAAGAAACTT CAC GCT GGACT AC 1 1A1 AGGGGLLL1 bAbALLAALLLLLbbLLAbbbAb 1 


1 1 4 n 


Qy 


1239 


TGCTCAGTGGGCCCCTCCTCTGATAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATG 


1298 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1141 


m^^mr*^ ^m/^/~/^/^/^/^/^m/^/^m/"*rn/ F- *T\rp"7V 7\ fTT*r+r**T*C A /TTprnf*A r Pf*A A^^AP*f~*A l T ,r P r Pr*f~* , T , f"'Zi r Pr"* 

TGCTCAGTGGGCCCCTCCTCTGATAAGGLLL 1 GALL i 1 LAI bAAbbALLAl l l LL i gai g 


i 9 nn 

J. <L U \J 


Qy 


1299 


GATGAGCAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTT 


1358 




1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1201 


GATGAGCAAGTGGTGGGGALGLLLL1 GL1 GG1 bAAAl LI bbLb 1 bbAb 1 Al ALALbbL 1 1 




Qy 


1359 


GCAGTGGAGACAGCCCAGGGCCTTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACC 


1418 




1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 




Db 


1261 


GCAGTGGAGACAGCCCAGGGCC 1 X GA1 GGGLALAGLLA1 L 1 ibl LAI b/ J. ALL 1 bbbAALL 


1 ^90 
j. u 


Qy 


1419 


ACCACAGGGTCGCTCCACAAGGCTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAA 


1478 




I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1321 


tv /-*•/-» 7v r* 7v r* r* rrr* r* r* r*rn rr* 7V r* 7\ 7\ rTT^rnrrnrTrp AA/ r *'P/T , /T , A/'" , AfT , A frfPTP ATT^TTZPT'PPZi Zi 

ACCACAGGGTCGC I CCALAAGGL 1 G 1 GG 1 AAG I GGGGALAGLAG 1 GL i LAI L 1 GG I GGAA 




Qy 


1479 


GAGATTCAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAG 


1538 




1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 




Db 


1381 


/"» tv 7v rpm/"« 7V /^r^m/^mrp/^/~«/-«rTi/ , ~ , 7\ fr^r^rpf A AfT"* r P/"" r n r Pf'/T''A A r*r* r P/'" , P Zi PPT'PPPPPP PA PPP ZiP 

GAGATTCAGC I G I 1 LLL 1 GALLL 1 GAALL i G 1 1 LGLAALL 1 GLAGL 1 LGLLLLLALLLAbj 


i 44 n 


Qy 


1539 


GGTGCAGTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGT 


1598 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 




Db 


1441 


/~tti /-* t\ /~ , m/^ , mmm/ r ~ , m7\ / r ~'/~ , r~*mm/ r ~ , mr~*7\ 7\ r* r^^T* CT 1 r*" T±.CfT* T VCC % CCC*C1±.Cl.C t C Zi Qr ,r P OTP A CT 
GGTGCAGTGTTTGTAGGL 1 1 LI LAGGAGG1 Gl LI GGAGGG1 GLLLLGAGLLAALI bi.Abl 


i snn 

1 JUU 


Qy 


1599 


GTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCT 


1658 




II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 




Db 


loul 


Gl Li Al GAGAGL 1 G 1 G 1 GGAL 1 Gl Gl LL 1 1 LLLLGGLALLLLLAL Ibl bi^^ l UvjUAv/V/v> l 


1560 


Qy 




r* is. c* c* r* a Ar*r , T^o i ^r*r*r*npr*r^T i r*T i r*T i r , r*Pr , r' , PZi ZiPPTPZi Zi PTPPTPP A APP APPAP ATP 
GAG1 LLLGAALL 1 Gl 1 GLL 1 LL 1 Gl L 1 GLLLLLAALL 1 LAAL 1 v^L 1 vjvj/\m.\jv^^\vjjvj/\^,^-vi kd 


1718 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1561 


GAGT C CCGAACCT GTT GC CTCCT GT CT GC CCCCAAC CT GAACT C CT GGAAGC AGGACAT G 


1620 


Qy 


1719 


GAGCGGGGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCT 


1778 




M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 




Db 


1621 


GAGCGGGGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCT 


1680 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1779 CAGAGCCGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTC 1838 

I I I I I I I I I I I ! I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I M I I I I I I I I I I 
1681 CAGAGC C GCC CGCAAAT CATTAAAGAAGT C CT GGCT GT C C CCAACT CCAT C CT GGAGCT C 1740 

1839 CCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTC 1898 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I 
1741 CCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTC 1800 

1899 CC AGAAGC CT CTT CCACT GTCTACAAT GGCT C C CT CTT GCT GAT AGT GC AGGAT GGAGTT 1958 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 CCAGAAGCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGAT GGAGTT 1860 

1959 GGGGGTCTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTAC 2018 

II I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
1861 GGGGGTCTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTAC 1920 

2019 TGGGTGGACAGCCAGGACCAGACCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGG 2078 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1921 TGGGTGGACAGCCAGGACCAGACCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGG 1980 

2079 GAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAG 2138 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 GAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAG 2040 

2139 TCCTACTGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCC 2198 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2041 TCCTACTGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCC 2100 

2199 CTCATCATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGC 2258 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
2101 CTCATCATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGC 2160 

2259 T GT GAGAC CCT GC GC CCT GGGGAGAAGGC CC C GTTAAGCAGAGAGCAACACCT C C AGT CT 2318 

I I I I I I I II I I I I I I I I I I I I I I II I I I II I II I I I I I I I I I II I I I I I I I I I I I I I I I I 
2161 TGT GAGAC CCT GC GCC CT GGGGAGAAGGC C CCGTTAAGCAGAGAGCAACACCT CC AGT CT 2220 

2319 C C CAAGGAAT GCAGGACCT CT GCC AGT GAT GT GGACGCTGACAACAACT GC CTAGGCACT 2378 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I 
2221 C C CAAGGAAT GCAGGACCTCT GCCAGT GAT GT GGAC GCT GACAACAACT GC CTAGGCACT 2280 

2379 GAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGG 2438 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

22 81 GAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCACCTGGCCATGCTGG 2340 

2439 CT GGGCGGCC CAAGCACAGCCCT GACT AGGAT GACAGCAGCACAAAAGACCACCT TT CT C 24 98 

I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2341 CT GGGCGGCC CAAGCACAGCC CT GACT AGGAT GACAGCAGCACAAAAGACCACCT TT CT C 24 00 

2499 C C CT GAGAGGAGCTT CT GCT ACT CT GCAT C ACT GAT GACACTCAGCAGGGT GAT GCACAG 2558 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
2401 CCCTGAGAGGAGCTTCTGCTACTCTGCATCACTGAT GACACTCAGCAGGGT GATGCACAG 24 60 

2559 CAGTCTGCGTCCCCTATGGGACTCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGG 2618 

I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

24 61 CAGTCTGCCTCCCCTATGGGACTCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGG 2520 

2619 GGGCTACCCCCAGACCTGCTCCTACACTGATATTGAAGAACCTGGAGAGGATCCTTCAGT 2678 



Db 



2521 



I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGGCT ACC CC CAGAC CT GCT CCT AC ACT GAT AT T GAAGAAC CT GGAGAGGAT C CTT CAGT 2580 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



2679 T CT GGCC ATT CCAGGGAC C CT C C AGAAACAC AGT GTTT CAAGAGAC CCTAAAAAAC CT GC 2738 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
2581 T CT GGC CATT C CAG GGAC C CT C C AGAAACAC AGT GTTT CAAGAGAC CCTAAAAAAC CT GC 2640 



2739 



2798 



CT GTC C CAGGACC CT AT GGT AAT GAAC AC CAAAC AT CT AAACAAT CAT AT G CT AAC AT GC 
I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2641 CT GTC CCAGGACC CT AT GGTAATGAACAC CAAAC AT CT AAACAAT CAT AT GCTAAC AT GC 2700 



2799 



C ACT CCT GGAAACT C C ACT CT GAAGCT GC C G CTTTGGAC AC CAACACT C C CTT CT CC CAG 2858 
I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2701 CACTCCTGGAAACTCCACTCTGAAGCTGCCGCTTTGGACACCAACACTCCCTTCTCCCAG 2760 

2859 GGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCA 2918 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2761 GGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCA 2820 

2919 GGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGAT 2978 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
2821 GGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGAT 28 80 

2979 CCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAG 3038 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I 
2881 CCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAG 294 0 

3039 CTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTG 3098 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2941 CTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTG 3000 

3099 TCAGA 3103 

I I I I I 
3001 TCAGA 3005 



RESULT 2 

HSM807023 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



CONSRTM 

TITLE 

JOURNAL 



GI:34365195 



( human ) 



COMMENT 



HSM807023 3151 bp mRNA linear HTC 22-SEP-2004 

Homo sapiens mRNA; cDNA DKFZp686D04248 (from clone DKFZp686D04248 ) . 
BX640891 
BX640891.1 
HTC. 

Homo sapiens 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 
1 (bases 1 to 3151) 
Ottenwaelder , B . , Obermaier, B . 
Mewes,H.W., Weil,B., Amid,C, 
Wiemann, S . 

The German cDNA Consortium 
Direct Submission 
Submitted (22-SEP-2004 ) MIPS, 
Neuherberg, GERMANY 

Clone from S. Wiemann , Molecular Genome Analysis, German Cancer 
Research Center (DKFZ); Email s.wiemann@dkfz-heidelberg.de; 



Craniata; Vertebrata; Euteleostomi ; 
Catarrhini; Hominidae; Homo. 

, Deutschenbaur, S. , Schaipp,A., 
Osanger,A., Fobo,G., Han,M. and 



Ingolstaedter Landstr.l, D-85764 



sequenced by Medigenomix (Martinsried/Germany) within the cDNA 
sequencing consortium of the German Genome Project. 
This clone (DKFZp686D04248 ) is available at the RZPD Deutsches 
Ressourcenzentrum fuer Genomf orschung GmbH in Berlin, Germany. 
Please contact RZPD for ordering: 

http://www.rzpd.de/cgi-bin/products/cl.cgi?CloneID=DKFZp686D0424 8 
Further information about the clone and the sequencing project is 
available at http://mips.gsf.de/projects/cdna/. 
FEATURES Location/Qualifiers 
source 1. .3151 

/organism="Homo sapiens" 
/mol_type="mRNA" 

/db_xref="RZPD:DKFZp686D0424 8Q" 
/db_xref="taxon:9606" 
/clone="DKFZp686D0424 8" 
/tissue_type="salivary gland" 

/clone_lib=" 686 (synonym: hlcc3) . Vector pSportl_Sfi; host 
DH10B; sites SfilA + SfilB" 
/ de v_s t age= " adul t " 

/note="Semaphorin B, differentially spliced, alternative 
start" 

gene 1. .3151 

/gene="DKFZp68 6D04248" 
CDS 217. .2388 

/ gene= " DKFZp 6 8 6D0 4 2 4 8 " 

/codon_start=l 

/product="hypothetical protein" 
/protein_id="CAE45942 . 1" 
/db_xref="GI : 34365196" 
/db_xref="UniProt/TrEMBL:Q6MZT6" 

/translation="MPRVRYYAGDERRALSFFHQKGLQDFDTLLLSGDGNTLYVGARE 
AI LALDIQDPGVPRLKNMI PWPAS DRKKS ECAFKKKSNETQCFNFI RVLVS YNVTHLY 
TCGTFAFSPACTFIELQDSYLLPISEDKVMEGKGQSPFDPAHKHTAVLVDGMLYSGTM 
NNFLGSEPI LMRTLGSQPVLKTDNFLRWLHHDAS FVAAI PSTQWYFFFEETAS EFDF 
FERLHTSRVARVCKNDVGGEKLLQKKWTTFLKAQLLCTQPGQLPFNVIRHAVLLPADS 
PTAPHI YAVFT SQWQVGGTRS S AVCAFS LLDI ERVFKGKYKELNKETSRWTT YRGPET 
NPRPGSCSVGPSSDKALTFMKDHFLMDEQVVGTPL^ 

HLVTyrfLGTTPGSLHKAWSGDSSAHLV^EIQLFPDPEPVl^LQIAPTQGAVFVGFSGG 
VWRWRANCSVTESCVT)CvTjARDPHCAWDPESRTCCLLSAPNLNSWKQDMERGNPEWA 
CASGPMSRSLRPQSRPQIIKEVT^VPNSILELPCPHLSALASYYWSHGPAAVPEASST 
VYNGSLLLIVQDGVGGLYQCWATENGFS YPVI S YWVDSQDQTLALDPELAGI PREHVK 
VP LT RVS GGAALAAQQ S YW P H FVT VT VL FALVL S GAL 1 1 LVAS P L RAL RARGKVQ GC E 
TLRPGEKAPLSREQHLQSPKECRTSASDVDADNNCLGTEVA" 

ORIGIN 

Query Match 93.1%; Score 2927.6; DB 3; Length 3151; 

Best Local Similarity 99.7%; Pred. No. 0; 

Matches 2933; Conservative 0; Mismatches 9; Indels 0; Gaps 0; 

Qy 202 GAGGCGGGCAGGGGCCCAT GCCCAGGGT CAGATACT ATGCAGGGGAT GAACGTAGGGCAC 261 

I III I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 200 GTGGCT GAGCAT GGCC CAT GC CCAGGGT CAGATACT AT GCAGGGGAT GAACGTAGGGCAC 259 



Qy 262 T T AGCTT CTT CCACCAGAAGGGCCT CC AGGATT TT GACACT CT GCT CCTGAGT GGT GAT G 321 

I I I I I I I I I I I I I I I I I I I I I I I II 1 I II II I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 260 TTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATG 319 



Qy 


o o o 


r^7\ 7v Am a r*rnr*rnr*rm\ r*> r^rnr* r*f~* cr" CTT^ (™ 7\ C 1\ A CCC '^ r V T VC r Pr^r , T t C r WrT* AT 1 'h^CC AfUfZATfT* Af^ 
bAAAl AC 1 L 1 L I ALb 1 bbbbbL 1 LbAb/v\o^U/\l ll^Hjtj^L*! 1 bb/il n J. LL/\bo/\l ^l/\>j 


JO 1 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l 




Db 


320 


GAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGGCCTTGGATATCCAGGATCCAG 


379 


Qy 


382 


GGGTCCCCAGGCTAAAGAAGAI GA1 ACCG 1 GGCCAGCGAG 1 bAbAbAAAAAAbAb i 


4 4 1 

*i H, -L 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


380 


GGGTCCCCAGGCTAAAGAACATGATACCGTGGCCAGCCAGTGACAGAAAAAAGAGTGAAT 


439 


Qy 


442 


GTGCCTTTAAGAAGAAGAGCAATGAGACACAGi Gl 1 1 GAACT1 CA1 GGG1 Gl bt 1 CC 111 


■J W X 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 




Db 


440 


GTGCCTTTAAGAAGAAGAGCAATGAGACACAGTGTTTCAACTTCATCCGTGTCCTGGTTT 


499 


Qy 


502 


CTTACAATGTCACCCATCTCTACACCTGCGGCACGl IbbLLl ibAbbbblbtl idACd 


Jul 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


500 


CTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCT 


559 


Qy 


562 


TCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGGAGGACAAGGI LAI bbAbbbAA 


DZ 1 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


560 


TCATTGAACTTCAAGATTCCTACCTGTTGCCCATCTCGGAGGACAAGGTCATGGAGGGAA 


619 


Qy 


622 


AAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGCTGTCr 1 GG1 GGA1 GGGA1 brb 


O o 1 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


620 


AAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGTGGATGGGATGC 


679 


Qy 


682 


TCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGCCCATCCTGATGCGCACAL 1 bb 


1 fi L 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


680 


TCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGCCCATCCTGATGCGCACACTGG 


739 


Qy 


742 


GATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCTGGCTGCAi CA1GACGUC1 btl 


ft 01 
QUI 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


740 


GATCCCAGCCTGTCCTCAAGACCGACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCT 


799 


Qy 


802 


TTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCT1 CI 1 C GAG GAG AC AG C LAb C C 


ft £i 

O D JL 




i ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


800 


TTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGAGGAGACAGCCAGCG 


859 


Qy 


862 


AGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGGCTAGAG 1 G 1 GGAAGAA1 bAbb 


QO 1 
Z ± 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


860 


AGTTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGGCTAGAGTCTGCAAGAATGACG 


919 


Qy 


922 


TGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCTTCCTGAAGGGGGAGG 1 GG 1 G 1 


Qft 1 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


920 


TGGGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCT 


979 


Qy 


982 


GCACCCAGCCGGGGCAGCTGCCC 1 1 GAAGG i GA1 GGGGGACbrCbrC 1 bb 1 CC 1 bbLLbbLb 


1 04 1 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


980 


GCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCG 


1039 


Qy 


1042 


tv mmr"mrir , r , 7i 7\ r~> rrrt rTT* r* ~T\ r* Amrrp t\ r* r* r*T\ / r ^ r P/ r ~ ,r P'T , /^ , A /^r^T 1 /^f^^A/^T^^^^A^^ , T , T 1 ^f^^f2f'IlfIlA 

ATTCTCCCACAGCTCCCCACAi G 1 AGGGAG 1 G 1 1 bAbb 1 CCCAbj 1 CCCAiaC 1 1 LjLfC^jLivjA 


1101 

JL J- U J. 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 




Db 


1040 


ATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGA 


1099 


Qy 


1102 


CCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTTTAAGGGGA 


1161 




1 1 1 1 1 1 1 1 1 i 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 i 1 M 1 M 




Db 


1100 


CCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTTTAAGGGGA 


1159 


Qy 


1162 


AAT ACAAAGAGTT GAACAAAGAAACTT C ACGCT GGACT ACTT AT AGGGGC C CT GAGAC C A 


1221 



1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 



Db 


i i £n 




1219 


Qy 


1222 


ACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGATAAGGCCCTGACCTTCATGA 


1281 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


-toon 
1ZZU 


U U O U bj b? O Ot\Lj 1 1 bL 1 b^rvbj 1 bbbLLL^ 1 v^b> ibi x r-\J-\\j 1 ± ± 


1279 


Qy 


1282 


AGGACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCG 


1341 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


t o o r\ 

1280 


AGGAOCAl I 1 CO 1 bAl GGA1 GAGCAAG 1 GG 1 ijbjbxbj/\L^CL,UL. 1 b*v_ 1 brbi 1 <a/\M/\l ^ l brbr^bi 


X O O Zf 


Qy 


1342 


T GGAGT AT ACAC GGCT T GCAGT GGAGAC AGCC CAGGGC CT T GAT GGGC AC AGC C AT CTT G 


1401 




I 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 M 1 1 1 1 




Db 


1340 


T GGAGT AT ACAC GGCT TGCAG I GGAGACAGCL.UAGGGUL 1 1 \3J\1 bbbLA^AbtL./\i ^lio 


J. O -7 _7 


Qy 


1402 


TCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGGCTGTGGTAAGTGGGGACAGCA 


1461 




1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1400 


m/-"ivrTir , mi\opm( r, rr7\ A/^i^A/^r^r^r^A /"•^ r*m r* ff^rp C* C Af^AAr^f^r^T^^T 7 /~/"T , AA/^ r Pi"*f* >, r"**<'!IAr' , Af2f , 'A 

TCATGTACCTGGGAACCACCCCAGGG 1 CGU 1 COALAAGGL, i G 1 (jGI /\A.bj 1 bjbjbjbxRU/\bib*/\ 




Qy 


1462 


GTGCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGC 


1521 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 




Db 


1460 


GTGCTCATCTGGTGGAAGAGAI I L.AGC ibll LLL 1 GACOC 1 GAAOU ibl 1 LbbARbb 1 bxb. 


1 M Q 


Qy 


1522 


AGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGC 


1581 




I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1520 


AGCTGGCCCCCACCCAGGGTGCAG I GT r I G 1 AGGC 1 1L1 UAGGAGG 1 bx 1 U 1 bjbx/vbjbxbj 1 bU 




Qy 


1582 


CCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCC 


1641 




I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1580 


CCCGAGCCAACTGTAGTGTCTATGAGAGCI GI bi GGAC1 G.L bl LL1 1 bjUCCbjbjbi/\L.ULb^ 


lOJ-7 


Qy 


1642 


ACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACT 


1701 




I 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1640 


ACTGTGCCTGGGACCCTGAGTCCCGAACCTG 1 1 GCC i CC 1 G 1 C 1 bLbbLbAAbb 1 bxrAAO L 


1 £QQ 

± O J 


Qy 


1702 


CCT GGAAGC AGGAC AT GGAGC GGGGGAAC CC AGAGTGGGC AT GTGC CAGT GGCCCCAT GA 


1761 




I | | | I I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


1 n Art 

1 /uu 


LC 1 GGAAGCAGGACA1 GGAGCGGobjbj/\AUUbv/\bj/\.bx 1 bbbb/\l br 1 bjL,b-/\ij X brbib^b*b.>\± 0^. 


1 7SQ 


Qy 


1762 


GCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCA 


1821 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1760 


GCAGGAGCCTTCGGCC1 LAbAbbbbbbbbbAA/il LAI 1 A/\tt.o/\/\^j -L Lbl ia(jv^Hji 


1 ft 1 Q 


Qy 


1822 


ACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTC 


1881 




1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 




Db 


i o o n 


a r , ^ppR^rPTrr»rpT i rrrrTrr , rrr , i , 'Zirr r rr r rr2!vrrrT , Tri^rrTrTTATTATTrinAnTr 


1879 


Qy 


1882 


ATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGA 


1941 




1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 




uu 


i ft an 


ATr;f;rrrA^;rAGrAGTrrCAG7VAGCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGA 


1939 


Qy 


1942 


TAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCAT 


2001 




I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 




Db 


1940 


TAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCAT 


1999 


Qy 


2002 


ACCCTGTGATCTCCTACTGGGTGGACAGCCAGGACCAGACCCTGGCCCTGGATCCTGAAC 


2061 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 



Db 2000 AC C CT GT GAT CTC CT ACT G GGT GGACAGC CAGGAC C AGAC CCT GGC C CT G GAT C CT GAAC 2059 

Qy 2062 TGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCG 2121 

II II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 2060 TGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCG 2119 

Qy 2122 CCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCT 2181 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2120 CCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCT 2179 

Qy 2182 T AGT GCTT T CAGGAGCC CT CAT CAT C CT C GT GGCCT C C CC AT T GAGAGCACT CC GGGCT C 2241 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I. I 
Db 2180 TAGTGCTTTCAGGAGC CCT CAT CAT CCTCGT GGC CTCCCCATT GAGAGCACT CC GGGCT C 2239 

Qy 2242 GGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGCAGAG 2301 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2240 GGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGCAGAG 2299 

Qy 2302 AGCAAC AC CT CCAGT CT C C CAAGGAAT GCAGGAC CT CT GCCAGT GAT GT GGAC GCT GAC A 2361 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2300 AGCAACAC CT C CAGT CT C C CAAGGAAT GCAGGAC CT CT GC CAGT GAT GT GGAC GCT GAC A 2359 

Qy 2362 ACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAG 2421 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 2360 ACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAG 2419 

Qy 2422 GC AC CT GGCCATGCT GGCTGGGCGGCC CAAGCACAGCCCT GACT AGGAT GAC AGCAGC AC 2481 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2420 GC AC CT GGC C ATGCT GGCT GGGCGGCC CAAGCACAGC CCT GACT AG GAT GAC AG CAGC AC 2479 

Qy 2482 AAAAGAC C AC CTTT CT C C CCTGAGAGGAGCTT CT GCT ACT CT GC AT C ACT GAT GACACT C 2541 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2480 AAAAGACCACCTTTCTCCCCTGAGAGGAGCTTCTGCTACTCTGCATCACTGATGACACTC 2539 

Qy 2542 AGC AGGGT GAT GCAC AGC AGTCTGC CT C C CCT AT GGGACT C C CT T CT AC CAAGC AC AT GA 2601 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2540 AGCAGGGT GAT GCACAGCAGTCTGC CT C C CCT AT GGGACT C C CT T CT AC CAAGCAC AT GA 2599 

Qy 2602 GCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCCTACACTGATATTGAAGAACCT 2661 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2600 GCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCCTACACTGATATTGAAGAACCT 2659 

Qy 2662 GGAGAGGAT CCTTCAGTTCTGGCCATTCCAGGGACCCT CCAGAAACACAGT GTTTCAAGA 2721 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2660 GGAGAGGATCCTT CAGTT CTGGCCATTCCAGGGACCCTCCAGAAACACAGTGTTT CAAGA 2719 

Qy 2722 GAC C CT AAAAAAC CT GC CT GTCCCAGGAC C CT AT GGTAAT GAAC ACCAAACAT CT AAAC A 2781 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2720 GACCCT AAAAAAC CT GC CT GT C C CAGGAC C CT AT GGTAAT GAAC AC C AAAC AT CT AAAC A 2779 

Qy 2782 AT CAT ATGCT AAC AT GCCACT C CT GGAAACTCCACT CT GAAGCT GC C GCTT T GGAC AC CA 2841 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2780 AT CAT AT GCTAAC AT GC CACT CCT GGAAACTCCACT CT GAAGCT GC C GCTTT GGAC AC CA 2839 

Qy 2842 ACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCAGTCG 2901 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II II I I I I I I I II I I I I I I I I I 

Db 2840 ACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCAGTCG 2899 



Qy 2902 TGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCTTCAG 2961 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2900 TGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCTTCAG 2959 

Qy 2962 TTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCCTTCT 3021 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2960 TTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCCTTCT 3019 

Qy 3022 TCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGG 3081 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3020 TCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGG 3079 

Qy 3082 ATT CAGAAAACT GCTTGT C AGAGACT GTT T ATTTTT T ATTAAAAAT ATAAGGCTT AAAAA 3141 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3080 ATT CAGAAAACT GCTT GT CAGAGACT GT T T ATT TTT T ATT AAAAAT AT AAGG CTT AAAAA 3139 

Qy 3142 AA 3143 

I I 

Db 3140 AA 3141 
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AY402621 2172 bp DNA linear GSS 12-DEC-2003 

Homo sapiens HCM1285 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY402621 

AY402621.1 GI: 39758607 
GSS. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; Primates; 

1 (bases 1 to 2172) 

Clark, A. G. , Glanowski, S . , Nielson,R., Thomas, P., Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp -mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 2172) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualifiers 
1. .2172 

/organism="Homo sapiens" 
/mol_type="genomic DNA" 



/db_xref="taxon:9606" 
gene <1. .>2172 

/locus_tag="HCM1285" 

ORIGIN 

Query Match 59.6%; Score 1874; DB 9; Length 2172; 

Best Local Similarity 86.3%; Pred. No. 0; 

Matches 1874; Conservative 0; Mismatches 298; Indels 0; Gaps 0; 



Qy 105 ATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAA 164 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 1 ATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAA 60 

Qy 165 CTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCC 224 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 61 CTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCC 120 

Qy 225 AGGGT C AGAT ACT AT GCAGGGGAT GAAC GT AGGGC ACTT AGCTT CTT C CAC CAGAAGGGC 284 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 AGGGT CAGAT ACT AT GCAGGGGAT GAACGTAGGGCACTT AGCTT CTT C CAC CAGAAGGGC 180 

Qy 285 CTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCT 344 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCT 240 

Qy 34 5 CGAGAAGCCATT CTGGCCTT GGAT AT CCAGGAT C CAGGGGT C CC CAGGCTAAAGAAC AT G 4 04 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 CGAGAAGCCATTCTGGCCTTGGATATCCAGGATCCAGGGGTCCCCAGGCTAAAGAACATG 300 

Qy 405 AT ACCGTGGCCAGCCAGT GACAGAAAAAAGAGTGAAT GTGC CTTTAAGAAGAAGAGCAAT 4 64 

I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 AT ACCGTGGCCAGCCAGT GACAGAAAAAAGAGTGAAT GT GCCTTTAAGAAGAAGAGCAAT 360 

Qy 4 65 GAGACACAGT GT T TCAACTTCAT C C GT GT C CT GGT T T CT T ACAAT GT CAC C C AT CT CT AC 524 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GAGACACAGT GTT TCAACTTCATC C GT GT C CT GGT TT CTT ACAAT GT C AC CCAT CT CTAC 420 

Qy 525 ACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTAC 584 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 ACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTAC 4 80 

Qy 585 CTGTTGCCCATCTCGGAGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCC 644 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 CT GT T GC CCAT CT CGGAGGACAAGGT CAT GGAGGGAAAAGGC CAAAGCCCCTTT GAC C C C 540 

Qy 645 GCT C AC AAGC AT ACGGCT GT CTTGGT GGAT GGGAT GCT CT ATTCT GGT ACT AT GAACAAC 704 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 541 GCT CACAAGCAT ACGGCT GTCTT GGT GGAT GGGAT GCT CT ATTCT GGT AC TAT GAACAAC 600 

Qy 705 TTCCTGGGCAGTGAGCCCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACC 764 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 T TCCTGGGCAGT GAGCCCAT C CT GAT GC GC ACACT GGGATC C CAGCCT GT C CT CAAGACC 660 

Qy 765 GACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACC 824 

I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 GACAACTTCCTCCGCTGGCTGCATCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 720 



Qy 825 CAGGTCGTCTACTTCTTCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTC 884 

Db 721 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 780 

Qy 885 CACACATCGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAG 944 

Db 781 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 840 

Qy 945 AAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCC 1004 

Db 841 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 900 

Qy 1005 TTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATC 1064 

Db 901 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 960 

Qy 1065 TACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCC 1124 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 NNNNNNNNNNNNNNNNNNNNNNNGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCC 1020 

Qy 1125 TT CT CT CT CT T GGACATT GAACGT GT CTTTAAGGGGAAAT ACAAAGAGTT GAACAAAGAA 1184 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 TTCTCTCTCTTGGACATTGAACGTGT CTTTAAGGGGAAAT ACAAAGAGTTGAACAAAGAA 1080 

Qy 1185 ACTTCACGCTGGACTACTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCA 1244 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 ACTT C AC GCT GGACT ACTT ATAGGGGC C CT GAGAC CAAC CC C CGGCCAGGC AGTTGCTC A 1140 

Qy 1245 GT GGGC C C CT C CT CT GATAAGGCC CT GAC CTT C AT GAAG GAC CAT TT C CT GAT GGAT GAG 1304 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 GTGGGCCCCT C CT CT GATAAGGCC CTGAC CTTCAT GAAGGAC CATTT C CT GAT GGAT GAG 1200 

Qy 1305 CAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTG 1364 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 CAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTG 12 60 

Qy 1365 GAGACAGCCCAGGGCCTT GAT GGGCACAGCCAT CT T GT CAT GT ACCT GGGAAC CAC CAC A 1424 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 GAGAC AGCCCAGGGCCTT GAT GGGC ACAGC CAT CT T GT CAT GT ACCT GGGAAC CAC CAC A 1320 

Qy 1425 GGGTCGCTCCACAAGGCT GTGGTAAGT GGGGACAGCAGT GCT CATCTGGT GGAAGAGATT 1484 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 GGGT C GCT C CACAAGGCT GT GGTAAGT GGGGACAGCAGT GCT C AT CT GGT GGAAGAGAT T 1380 

Qy 1485 CAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCA 1544 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 CAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCA 1440 

Qy 1545 GTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTAT 1604 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I 
Db 1441 GTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTAT 1500 

Qy 1605 GAGAGCTGTGT GGACT GTGTC CTT GCCCGGGACCCCC ACT GTGCCTGGGACCCTGAGTCC 1664 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1501 GAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCC 1560 

Qy 1665 CGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGG 1724 



Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I 
1561 CGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGG 1620 

1725 GGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGC 1784 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
1621 GGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGC 168 0 

1785 CGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGC 184 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 CGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGC 174 0 

1845 C C C C AC CT GT CAGC CT TGGCCT CTT ATT ATT GGAGT CAT GGC CCAGCAGC AGT C CC AGAA 1904 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 C C C CAC CT GT CAGCCT TGGCCT CTT ATT ATT GGAGT CAT GGC CCAGCAGC AGT C C C AGAA 1800 

1905 GCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGAT GGAGT TGGGGGT 1964 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I 
1801 GCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGT 18 60 

1965 CTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTG 2024 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1861 CTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTG 1920 

2025 GAC AGC CAGGAC CAGACC CT GGC CCT GGAT C CT GAACT GGCAGGCAT C CC C CGGGAGCAT 2084 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
1921 GACAGC CAGGAC CAGACC CT GGCCCT GGAT C CT GAACT GGCAGGCAT C CC C CGGGAGCAT 1980 

2085 GTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTAC 2144 

I I I I I I I II I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 GTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTAC 204 0 

2145 TGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATC 22 04 

II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
2041 TGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATC 2100 

2205 ATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAG 2264 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 ATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAG 2160 

2265 ACCCTGCGCCCT 227 6 

I I I I I I I I I I I I 
2161 ACCCTGCGCCCT 2172 
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Qy 

Db 



105 ATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAA 164 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I 
1 ATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAA 60 



Qy 

Db 



165 CTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCC 224 
I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
61 CTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGANNCGGGCAGGGGCCCATGCCC 120 



Qy 



Db 



225 AGGGTCAGATACTATGCAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAGAAGGGC 284 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I 
121 AGGGT CAGAT ACT AT GC AGGGGAT GAAC GT AG GGCACTT AG CTT CT T C CAC CAGAAGGGC 180 



Qy 

Db 

Qy 

Db 

Qy 

Db 



285 CTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCT 344 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 CTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCT 240 

345 C GAGAAGC CATT CT GGCCTTGGAT AT C CAGGAT CCAGGGGT CC C CAGGCTAAAGAAC AT G 4 04 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
241 CGAGAAGCCATT CT GGC CTT GGAT AT CCAGGAT CCAGGGGT CC C C AGGCTAAAGAACAT G 300 

405 AT ACC GT GGCCAGCCAGT GACAGAAAAAAGAGT GAAT GT GCCTTT AAGAAGAAGAGCAAT 464 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 AT ACCGT GGC CAGCC AGTGACAGAAAAAAGAGT GAAT GT GCCTTT AAGAAGAAGAGCAAT 360 



Qy 



4 65 GAGACAC AGT GTTT CAACTT C ATC CGT GT CCT GGTTT CTTACAAT GT C ACC CAT CT CT AC 524 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



361 GAGACAC AGTGTTT CAACT T C AT CCGT GT C CTGGTTT CTT ACAAT GTCAC C CAT CT CT AC 420 

525 ACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTAC 584 

I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

421 ACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGATTCCTAC 480 

585 CTGTTGCCCATCTCGGAGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCC 644 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I 
481 CTGTTGCCCATCTCGGAGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCC 540 

645 GCT CAC AAGCAT ACGGCT GT CTTGGTGGAT GGGATGCT CT AT T CT GGT ACT ATGAACAAC 704 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 GCTCACAAGCATACGGCTGTCTTGGTGGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 600 

705 TT C CT GGGC AGT GAGC C CAT CCT GAT GC GCACACT GGGAT CC C AGC CT GT C CT CAAGAC C 764 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 NTCCTGGGCAGTGAGCCCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTCAAGACC 660 

765 GACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACC 824 

I I I I I I I I I I I I I I I I I I I I I I I I I 
661 GACAACTTCCTCCGCTGGCTGCATCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 720 

825 CAGGTCGTCTACTTCTTCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAGAGGCTC 884 

721 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 780 

885 CACACATCGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTGCTGCAG 944 

781 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 840 

945 AAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCC 1004 

841 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 900 

1005 TTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATC 1064 

901 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 960 

1065 TACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCC 1124 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 NNNNNNNNNNNNNNNNNNNNNNNGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCC 102 0 

1125 TT CTCT CT CTT GGACAT T GAACGT GT CTTTAAGGGGAAAT ACAAAGAGT T GAACAAAGAA 1184 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 TT CT CT CT CTT GGACATT GAAC GT GT CTTTAAGGGGAAAT ACAAAGAGTT GAACAAAGAA 1080 

1185 ACTTCACGCTGGACTACTTATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCA 1244 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 ACTTCACGCTGGACT ACTT AT AGGGGCC CT GAGACCAAC C CC C GGCCAGGCAGT T GCT CA 114 0 

1245 GTGGGCCCCTCCTCTGATAAGGCCCTGACCTTCATGAAGGACCATTTCCTGATGGATGAG 1304 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 GTGGGCCCCTCCTCTGATAAGGCCTTGACCTTCATGAAGGACCATTTCCTGATGGATGAG 1200 

1305 CAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTG 1364 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 CAGGTGGTAGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTG 1260 



Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1365 GAGACAGCCCAGGGC CTT GATGGGCACAGC CAT CTT GT CAT GT AC CT GG GAAC CAC C ACA 1424 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1261 GAGACAGCCCAGGGCCTTGATGGGCACAGCCATCTTGTCATGTACCTGGGAACCACCACA 1320 

1425 GGGTCGCTCCACAAGGCTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGAAGAGATT 14 84 

I I I I II I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M 

1321 GGGTCGNTCCACAAGGCTGTGGTAAGTGGGGACAGCAGTGCTCATCTGGTGGANNNNNTT 1380 

1485 CAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCA 1544 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1381 CAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCA 1440 

1545 GTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTAT 1604 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1441 GTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTAT 1500 

1605 GAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCC 1664 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1501 GAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGATCCTGAGTCC 1560 

1665 CGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGG 1724 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

1561 CGAACCTGTTGCCTCCTNNNNNNNNNNNNNNNGAACTCCTGGAAGCAGGACATGGAGCGG 1620 

1725 GGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGC 1784 

II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
1621 GGGAAC C CAGAGT GGGC AT GT GCCAGT GGC CC CAT GAGCAGGAGC CTT C GGC CT CAGAGC 168 0 

1785 CGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGC 1844 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I 

1681 CGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCTAACTCCATCCTGGAGNTCCCCTGC 174 0 

1845 CCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAA 1904 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I II I I I I I I 

1741 CCCCACCTGTCAGCCTTGGCCTCTTACTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAA 1800 

1905 GCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGT 1964 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1801 GCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGT 1860 

1965 CTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTG 2024 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1861 CTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTG 1920 

2025 GAC AGCCAGGACCAGAC CCT GGCC CTGGATC CT GAACT GGCAG GC AT CCC C C GGGAGC AT 2084 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1921 GACAGCCAGGACCAGACCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCAT 1980 

2085 GTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTAC 2144 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I 

1981 GTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTAC 2 04 0 

2145 TGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATC 2204 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2041 TGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATC 2100 



Qy 2205 ATCCTCGTGGCCTCCCCATTGAGAGCACTCCGG 2237 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 ATCCTCNTGGCCTCCCCANNGAGAGCACTCCGG 2133 
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AK077976 3206 bp mRNA linear HTC 03-APR-2004 

Mus musculus 13 days embryo male testis cDNA, RIKEN full-length 
enriched library, clone : 6030492A12 product : sema domain, 
immunoglobulin domain (Ig) , transmembrane domain (TM) and short 
cytoplasmic domain, (semaphorin) 4A, full insert sequence. 
AK077976 

AK077976.1 GI: 26097602 
HTC; CAP trapper. 
Mus musculus (house mouse) 
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Query Match 55.6%; Score 1747.4; DB 3; Length 3206; 

Best Local Similarity 76.7%; Pred. No. 0; 

Matches 2355; Conservative 0; Mismatches 621; Indels 95; Gaps 14; 



Qy 75 GAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGCCCTCCCAGCCCTGGGCCTGGACCCC 134 

III I II I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 194 GAACCAT CT GGT GACCAT CT CAGGCT GAC C AT GG C CCT AC CAT C CCT GGGC CAGGACT C A 253 

Qy 135 TGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCTTCAGCTGCTGCTGCCGACGACGACC 194 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I 

Db 254 TGGAGTCTCCTGCGTGTTTTTTTCTTCCAACTCTTCCTGCTGCCATCACTGCCACCTGCT 313 

Qy 195 GCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGTCAGATACTATGCAGGGGATGAACGT 254 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 314 T CT GGGACT GGT GGTCAGGGGC CCAT GCCCAGAGT CAAAT AC CAT GCT GGAGAC GGGC AC 373 

Qy 255 AGGGCACTTAGCTTCTTCCACCAGAAGGGCCTCCAGGATTTTGACACTCTGCTCCTGAGT 314 

I I II I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I 
Db 374 AGGGCCCTCAGCTTCTTCCAACAAAAAGGCCTCCGAGACTTTGACACGCTGCTCCTGAGT 433 

Qy 315 GGTGATGGAAATACTCTCTACGTGGGGGCTCGAGAAGCCATTCTGGCCTTGGATATCCAG 374 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I 
Db 434 GACGATGGCAACACTCTCTATGTGGGGGCTCGAGAGGCCGTCCTGGCCTTGAATATCCAG 493 

Qy 375 GAT CCAGGGGT C C CCAGGCTAAAGAACAT GAT AC C GT GGC CAGC CAGT GACAGAAAAAAG 434 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 494 AACCCAGGAAT C CCAAGGCT AAAGAACAT GAT AC C CT GGC CAGCCAGT GAGAGAAAAAAG 553 

Qy 435 AGTGAATGT GCCTTTAAGAAGAAGAGCAATGAGACACAGTGTTTCAACTT CATCCGTGT C 494 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 554 ACCGAATGTGCCTTTAAGAAGAAGAGCAATGAGACACAGT GTTTCAACTT CATTCGAGTC 613 

Qy 495 CTGGTTTCTTACAATGTCACCCATCTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCT 554 

I I I I I I I I I I I I I I I II II I I I II I I I I II I I I I I I I I I I I I I I I I I I I 
Db 614 CTGGTCTCTTACAATGCTACTCACCTCTATGCCTGTGGGACCTTTGCCTTCAGCCCTGCC 673 

Qy 555 T GT ACCTT CATT GAACT T CAAGATT C CT AC CT GT T GCC CAT CT C GGAGGACAAGGT CAT G 614 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 674 T GT ACCTT CAT T GAACT CCAAGATT CCCT C CT GT T GCC CAT CT TGAT AGACAAGGT CAT G 733 

Qy 615 GAGGGAAAAGGC CAAAGCCCCT TT GACCC C GCT C ACAAGCAT ACGGCT GT CTT GGT GGAT 674 

II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I III 

Db 734 GACGGGAAGGGC CAAAGC C C CT TT GAC CCT GTT C ACAAGCACACAGCT GT CT T GGT C GAT 793 

Qy 675 GGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGCCCATCCTGATGCGC 734 

I I I I II I I I I I I I II II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 794 GGGATGCTTTATTCCGGCACCATGAACAACTTCCTGGGCAGCGAGCCCATCCTGATGCGG 853 

Qy 735 ACACT GGGATC CCAGC CT GT C CTCAAGAC CGACAACTT C CT CC GCT GGCT GCAT CAT GAC 794 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II 
Db 854 ACACT GGGATC C C AGCCT GT T CTCAAGACT GAC AT CT T CT T AC G CT GGCT G CAC G C GGAT 913 

Qy 795 GCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGAGGAGACA 854 

I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I II I I I I I II I I II I I I I I I 
Db 914 GCCT CCTT CGT GGCAGC CATT C CATC CAC C CAGGT CGT CT AT TTCTT CTTT GAGGAGAC A 973 

Qy 855 GCCAGC GAGTTT GACTT CTTT GAGAGGCT C CACAC AT CGC GGGT GGCT AGAGT CT GCAAG 914 

I I I I I I I I I I I I I I I I I I I I I I I III I I III I I I I I I I I I I I I I I I I I I 

Db 974 GCCAGCGAGTTTGACTTCTTTGAAGAGCTGTATATATCCAGGGTGGCTCAAGTCTGCAAG 1033 

Qy 915 AAT GAC GT GGGCGGCGAAAAGCTGCT GC AGAAGAAGT GGACC AC CTT C CT GAAGGC CCAG 974 
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Db 


1214 
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1155 


Db 
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1215 


Db 
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Ov 
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Db 


1394 


Qv 


1335 


Db 


1454 


Ov 


1395 


Db 


1514 


Qv 


1455 


Db 


1574 


Qv 


1514 


Db 


1634 


QV 


1574 


Db 


1694 


Qy 


1634 


Db 


1754 


Qy 


1694 


Db 


1814 


Qy 


1754 



II MINIMI 1 I 1 I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I 1 M MINI 

AACGACGTGGGCGGTGAAAAGCTGCTGCAGAAGAAGTGGACCACCTTCCTCAAAGCCCAG 1093 

CTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCTC 1034 

I I II I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TTGCTCTGCGCTCAGCCAGGGCAGCTGCCATTCAACATCATCCGCCACGCGGTCCTGCTG 1153 

CCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCCCAGTGGCAGGTT 1094 

I || I I I I I I II I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

CCCGCCGATTCTCCCTCTGTTTCCCGCATCTACGCAGTCTTTACCTCCCAGTGGCAGGTT 1213 

GGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTTT 1154 

I I I II I I I I I I I I II I I II II I I I I I I I I I I I I I I I I I II I I I II II II I II I 

GGC G GGACCAGGAGCT CAGCAGT CT GT GC CTT CT CT C T CAC GGACAT T GAGCGAGT CT TT 1273 

AAG G GGAAAT ACAAAGAGTT GAACAAAGAAACT T C AC GCT GGACT ACTTAT AGG GGC C CT 1214 

II I I I I I I I I I I III I II I I I I II II II II II I I I I I II I I Mill I 

AAAGGGAAGT ACAAGGAGCT GAACAAGGAGAC CT C C C GCTGGAC C ACTT AC CGGGGCT C A 1333 

GAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGATAAGGCCCTGACC 1274 

III II III III I I I I I I I I I II I I I I I I I I M M I I I II II III I I I I I 
GAGGTCAGCCCGAGGCAAGGCAGTTGCTCCATGGGCCCCTCCTCTGACAAAGCCTTGACC 1393 

TTCATGAAGGACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGCCCCTGCTGGTGAAA 1334 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I Mill II II I I I I I I M M I I I I 
TTCATGAAGGACCATTTTCTGATGGATGAGCACGTGGTAGGAACACCCCTGCTGGTGAAG 1453 

TCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCCTTGATGGGCACAGC 1394 

I I I I I M I I I M I I M I I I I II I I I I I I I I MM I M II M II II I I I MM 

TCTGGTGTGGAGTACACACGGCTTGCTGTGGAGTCAGCTCGGGGCCTTGATGGGAGCAGC 1513 

CATCTTGTCATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGGCTGTGGTAAGTGGG 1454 

I II I I I II II M I I II I I I I M II I I I I I I I I M II I II I II I I I I I 

CATGTGGTCATGTATCTGGGTACCTCCACGGGGTCCCTGCACAAGGCTGTGGTGCCTCAG 1573 

GAC AGC AGT GCT CAT CTGGT GGAAGAGAT T CAGCT G- TT CC CT GACC CT GAAC CT GT T C G 1513 

I I I I I I II I I II I I I I I II I I I I II I II I I I I I I I I I I I I I I I I M I I I I II 

GACAGCAGT GCTT AT CT C GT GGAGGAGATT CAGCT GAGCCC CT GACT CT GAGCCT GTT C G 1633 

CAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCTCAGGAGGTGTCTG 1573 

I I I I I I II I II II I I II I II I I I I I I II M M II II I I I I M I I I II I I I MM 

AAACCTGCAGCTGGCCCCCGCCCAGGGTGCAGTGTTTGCAGGCTTCTCTGGAGGCATCTG 1693 

GAGGGT GCC C CGAGC CAACT GT AGT GT CT AT GAGAGCT GTGT GGACT GTGT C CTT GC C CG 1633 

Ml II III I I I I I I II I I I I I I M I M M II I I I I I I I II I I II I I I II I I 

GAGAGT T CCCAGGGC CAATT GCAGT GT CT AC GAGAGCT GTGT GGACT GT GT GCT T GC CAG 1753 

GGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAA 1693 

I II I I I I I M I I I I I I I I II III I I I I II I II I I I I I 

GGACCCTCACTGTGCCTGGGACCCTGAATCAAGACTCTGCAGCCTTCTGTCTGGCTCTAC 1813 

C CT GAACTCCT GGAAGC AGGACAT GGAGC GGGGGAACCCAGAGT GGGCAT GT GC CAGT GG 1753 

I II I II II I I I I I I I I I I I I I I I I I I II M I I I II II I II I I II I I 

c AAGCCTTGGAAGCAGGACATGGAACGCGGCAACCCGGAGTGGGTATGCACCCGTGG 1870 

CCCCAT GAG CAGGAGC CTT C GGCCT C AGAGCC GCC CGCAAAT CATTAAAGAAGT CCT GGC 1813 
|| | M I I I I I I I I I I I I I I I I I I I I I I III III I II I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 



1871 CCC C AT GGC C AGGAGC C CCC GGC GT CAGAGC CC C C CT CAACTAATT AAAGAAGT CCT GAC 1930 

1814 TGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTA 1873 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 1 I I 
1931 AGTCCCCAACTCCATCCTGGAGCTGCCCTGCCCCCACCTGTCAGCACTGGCCTCTTACCA 1990 

1874 TTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTTCCACTGTCTACAATGGCTCCCT 1933 

II I I I I I I I I I I I III I II I I I I I I I I I I I I II I I I I I I II I I I I I I I I I 
1991 CT GGAGT CAT GGC CGAGCC AAAAT CT C AGAAGC CT CTGCT AC C GT CT ACAAT G GCT C C CT 2050 

1934 CTTGCT GAT AGTGCAGGATGGAGT T GGGGGT CT CT ACC AGT GCT G GGCAACT GAGAAT GG 1993 

I I I I I I I I I I I I I I I I I II II II I I I I I I II I I I III I I I I I I I I II 

CTTGCTGCTGCCGCAGGATGGTGTCGGAGGCCTCTACCAGTGTGTGGCGACTGAGAACGG 2110 



2051 



2053 



1994 CTTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCCAGGACCAGACCCTGGCCCTGGA 

II I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2111 CTACTCATACCCTGTGGTCTCCTATTGGGTAGACAGCCAGGACCAGCCCCTGGCGCTGGA 2170 

2054 TCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGG 2113 

I I I II Mill III I I I I II I I I I MM I I I I II I I I I I II I I I M I I II 

2171 CCCTGAGCTGGCGGGCGTTCCCCGTGAGCGTGTGCAGGTCCCGCTGACCAGGGTCGGAGG 2230 

2114 TGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCACTGTCACTGTCCT 2173 

II M II I I I M I II I I I I II I I II II I I I I M I III III II II I I I I I 

2231 CGGAGCTTCCATGGCTGCCCAGCGGTCCTACTGGCCCCATTTTCTCATCGTTACCGTCCT 2290 

2174 CTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCCCATTGAGAGCACT 2233 
I I I M I II I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I 

2291 CCTGGCCATCGTGCTCCTGGGAGTGCTCACTCTCCTCCTCGCTTCCCCACTGGGGGCGCT 2350 

2234 CCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTT 2293 

I I I I II I I I II I I I I I I I I I I II I I I I II II I I III I I I I II I I I II I 
2351 GCGGGCTCGGGGTAAGGTTCAGGGCTGTGGGATGCTGCCCCCCAGGGAAAAGGCTCCACT 2410 

2294 AAGCAGAGAGCAAC ACCT C C AGTCT CC CAAGGAAT GCAGGAC CT CTGCCAGT GAT GT GGA 2353 

I I I I I II II I II I I I II I I I I II II I I II I I I I I I I I I I I I I I I II II 
2411 GAGCAGGGACCAGC ACCT CCAGC C CT C CAAGGAC CACAGGAC CT CTGCCAGT GACGT AGA 2470 

2354 CGCTGACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCT- 2412 

I I I II I I I I I I I I I I I I II I I I I I I I I I I III III 

2471 T GC C GACAACAAC CAT CT GGGC GC CGAAGTGGCTT AAAC AGGGAC AC AGAT C C GCAGCT G 2530 

2413 -GCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCT^AGCACAGCCCTGACTAGGATG 2471 

I I I I II II I I I I I I I I I II I I I I 

2531 AGCAGAGCAAGCCACTGGCCTTGTTGGCTATGC 2563 



2472 



2564 



2532 



ACAGCAGCACAAAAGAC C AC CTTT CT C C C CT GAGAGGAGCT T CT GCT ACT CT G CAT CACT 

Ml I II II I I I II I I I II I I II II I I I I 
CAGGC ACAGTGC CACT CT GAC CAGGGT AGGAGGCT CT C CTGCT AAC GT GT GT CACC 



GAT GAC ACT C AGCAGGGT GATGCAC AGCAGT CT GC CT CCC CT AT GGGACT C CCTTCT AC C 

I I M II I II I I I II II II I M I II I I I I M I I 

2620 TACAGCACCCAGTAGG TCCTCCCCTGTGGGACTCTCTTCTGCA 



2531 



2619 



2591 



2662 



2651 



2592 AAGCACAT GAGCT CT CTAAC AGGGT GGGGGCTACCC CC AGACCT GCT CCT ACACTGAT AT 

I I I I I I I I I M I I I II I I I I II I 

2663 AGCACATTGGGCTGTCT CCATACCTGTACTTGTGCTGTGAC 2703 



Qy 2652 T GAAGAACCT GGAGAGGAT CCTT CAGT T CT GGC CATTC CAGG GAC C CT CC AGAAACAC AG 2711 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2704 AGGAAGAGC C AGACAGGTTT CTTT GAT TTT GAT T GACC CAAGAGC CCT CCT GT AACAAAC 2763 

Qy 2712 T GTTTCAAGAGAC CCTAAAAAAC CT GC CT GT C CCAGGAC CCT AT GGT AAT GAAC ACCAAA 2771 

I I I I II III I I I I I I I I II I I I I I I I 

Db 2764 GT GCT C CAGGAGACCATGAAAGGT GT GGCT GT CT GGGAT T CT GT G GT GAC AAAC - CT AAG 2822 

Qy 2772 CATCTAAACAAT CATATGCTA ACATGCCACTCCTGGAAACTCCACTCT G 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2823 CAT CCGAGCAAGCT GGGGCT ATT C CT GCAAACT C CATC CTGAAC GCT GT C ACT C TAGAAG 28 82 

Qy 2821 AAGCTGCCGCTTTGGACACCAACACTCCCTTC-TCCCAGGGTCATGCAGGGATCTGCTCC 2 879 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II 

Db 2883 CAGCTGCTGCTTTGAACACCAGCCCACCCTCCTTCCCAAGAGTCTCTATGGAGTTGGCCC 2942 

Qy 2880 CTCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTG 2939 

II II I I I I I I I I II I I I I I I III I I I I I I I I I I I I I II I I I 

Db 2943 CTTGTGTTTCCTTTACCAGTCATGCCATACTGTTT GGGAAGT CAT CT CT GAAGT CT A 2999 

Qy 294 0 ACCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCT TCTGCCCTGGC-AG 2 995 

I I I I I I I I I I I I II I I I I II I I I II I II I I I II I II I I I I I I I I I II 
Db 3000 ACCACCTTCCTTCTTGCTTCAGTTTGGACAGATTGTTATTATTGTCTCTGCCCTGGCTAG 3059 

Qy 2996 AATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCT 3055 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3060 AATGGGGGGCATAATCTGAGCCTTGTTCCCTTGTCCAGTGTGGCTGACCCTTGACCTCTT 3119 

Qy 3056 CCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTT 3115 

II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3120 — CCTT C CT C CT C CCTTT GTT T T GGGAT T CAGAAAACT GCT T GT CAC AGACAAT T TAT T T 3177 

Qy 3116 TTTATTAAAAA 3126 

I I I I I I I I I I I 
Db 3178 TTTATTAAAAA 3188 
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FEATURES Location/Qualifiers 
source 1. .3086 

/organism="Mus musculus" 

/mol_t ype= "mRNA" 

/strain="C57BL/6J" 

/ db_xr e f = " FANTOM_DB : 9630018D15" 

/db_xref="taxon: 10090" 

/clone="9630018D15" 

/tissue_type=" cerebellum" 

/clone_lib="RIKEN full-length enriched mouse cDNA library" 
/dev_stage="16 days neonate" 
misc_feature 59. .2388 

/note="putative 

sema domain, immunoglobulin domain (Ig) , transmembrane 
domain (TM) and short cytoplasmic domain, (semaphorin) 4A 
(MGDIMGI: 107560, GB | NM_013658 , evidence: BLASTN, 99%, 
match=2517) " 

polyAjsignal 3062. .3067 

/ note="putative" 

polyA_site 3086 

/note="putative" 

ORIGIN 

Query Match 54.1%; Score 1701.4; DB 3; Length 3086; 

Best Local Similarity 75.2%; Pred. No. 0; 

Matches 2364; Conservative 0; Mismatches 637; Indels 141; Gaps 14; 

Qy 50 AACGCAGCGGCATCCCCAGGCTCCAGAGCTCCCTGGTGACAGTCTGTGGCTGAGCATGGC 109 

I I I I I I II I I I I I I I I I I I I I I III I II I I I I I I I I I 

Db 4 AAC C C AGAAAGT GCCT GTT TC CT CAGAACCAT CT GGT GAC CAT CT CAGGCT GAC CAT GGC 63 

Qy 110 CCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAACTGCT 169 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 64 CCTACCATCCCTGGGCCAGGACTCATGGAGTCTCCTGCGTGTTTTTTTCTTCCAACTCTT 123 

Qy 170 TCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCCAGGGT 229 

I I I I II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 124 CCTGCTGCCATCACTGCCACCTGCTTCTGGGACTGGTGGTCAGGGGCCCATGCCCAGAGT 183 

Qy 230 C AGAT ACT AT GCAGGGGAT GAACGT AGGGCACTT AG CT T CT T C CAC CAGAAGGGC CT CCA 289 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 184 CAAATACCATGCTGGAGACGGGCACAGGGCCCTCAGCTTCTTCCAACAAAAAGGCCTCCG 243 

Qy 290 GGAT TTT GACACT CT GCT C CT GAGT GGT GAT GGAAAT ACT CT CT ACGT GGGGGCT CGAGA 349 

II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 244 AGACTTT GACAC GCT GCT CCT GAGT GAC GAT GGCAAC ACT CT CTAT GT GGGGGCT C GAGA 303 

Qy 350 AGCC ATT CT GGC CTT GGAT AT C CAGGAT C CAGGGGT CCC C AGGCTAAAGAAC AT GAT AC C 4 09 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 

Db 304 GGC CGT CCT GGC CT T GAAT AT CC AGAAC C CAGGAAT CC CAAGGCTAAAGAACAT GAT AC C 363 



Qy 



410 GT GGC CAGCC AGT GACAGAAAAAAGAGT GAATGT GC CT T TAAGAAGAAGAGCAAT GAGAC 469 



1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 364 CT GGCC AGCCAGT GAGAGAAAAAAGAC C GAAT GT GC CT TTAAGAAGAAGAGCAAT GAGAC 423 

Qy 470 ACAGTGTTTCAACTTCATCCGTGTCCTGGTTTCTTACAATGTCACCCATCTCTACACCTG 529 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I II II I I I I I I I I I 

Db 424 ACAGTGTTTCAACTTCATTCGAGTCCTGGTCTCTTACAATGCTACTCACCTCTATGCCTG 483 

Qy 530 CGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATT 566 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 84 TGGGACCTTTGCCTTCAGCCCTGCCTGTACCTTCATTACGTGCGACCCTGGCATTCTGGG 543 

Qy 567 GAACTTCAAGATT C CT AC CT GT T GC C CAT CT C GGAG 602 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 544 CTCCCAGCCTCTTCCCCCCTCTAGGAACTCCAAGATTCCCTCCTGTTGCCCATCTTGATA 603 

Qy 603 GACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTTGACCCCGCTCACAAGCATACGGCT 662 

I I I III II I I I I II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 
Db 604 GACAAGGT CAT GGAC GGGAAGGGC CAAAGCC CCT TT GACC CT GTT CACAAGCACAC AGCT 663 

Qy 663 GTCTTGGTGGATGGGATGCTCTATTCTGGTACTATGAACAACTTCCTGGGCAGTGAGCCC 722 

I I I I I I I I I I I I I II I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 664 GTCTTGGTCGATGGGATGCTTTATTCCGGCACCATGAACAACTTCCTGGGCAGCGAGCCC 723 

Qy 723 AT CCTGAT GC GCACACT GGGAT CC CAGC CTGT C CT CAAGACC GACAACT T C CT C CGCT GG 782 

I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 724 ATCCTGATGCGGACACTGGGATCCCAGCCTGTTCTCAAGACTGACATCTTCTTACGCTGG 783 

Qy 783 CTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACCCAGGTCGTCTACTTCTTC 842 

I I I I I II II I I I I I I I I I I I I I I I I I II II I I I I II I I I I I I I I I I I I I I 

Db 784 CTGCACGCGGATGCCTCCTTCGTGGCAGCCATTCCATCCACCCAGGTCGTCTATTTCTTC 843 

Qy 843 TT CGAGGAGACAGCCAGCGAGTTT GACTT CT TT GAGAGGCT C C AC ACAT CGC GGGT GGCT 902 

II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I II 

Db 844 TT TGAGGAGACAGCCAGC GAGT TT GACTT CTTT GAAGAGCT GT AT AT AT C C AGGGT GG CT 903 

Qy 903 AGAGTCT GCAAGAAT GAC GT GGGC GGCGAAAAGCT GCT GC AGAAGAAGT GGAC C ACCT T C 962 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 904 CAAGTCT GCAAGAAC GAC GT GGGC GGT GAAAAG CT GCT GC AGAAGAAGT GGAC C AC CT T C 963 

Qy 963 CTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCAC 1022 

II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 964 CT CAAAGC CC AGT T GCT CTGCGCT CAGCCAGGGCAGCT GC CAT T C AACAT CAT C CGCC AC 1023 

Qy 1023 GCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCC 1082 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I 

Db 1024 GCGGTCCTGCTGCCCGCCGATTCTCCCTCTGTTTCCCGCATCTACGCAGTCTTTACCTCC 1083 

Qy 1083 CAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATT 1142 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1084 CAGTGGCAGGTTGGCGGGACCAGGAGCTCAGCAGTCTGTGCCTTCTCTCTCACGGACATT 1143 

Qy 1143 GAACGT GT CTTTAAGGGGAAAT ACAAAGAGTTGAACAAAGAAACTT C AC GCT GGACTACT 1202 

II II I I I I I I I I I I I I I II I I I III I I I I I I I II II II I I I I I I I I III 

Db 1144 GAGC GAGT CTTTAAAGGGAAGT ACAAGGAGCT GAACAAGGAGAC CT C CC GCT GGAC CACT 1203 



Qy 1203 TATAGGGGCCCTGAGACCAACCCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGAT 1262 

II I I I I I I III II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



1204 TACCGGGGCTCAGAGGTCAGCCCGAGGCCAGGCAGTTGCTCCATGGGCCCCTCCTCTGAC 1263 

1263 AAGGC CCT GACCTT CAT GAAGGAC CATTT CCT GAT G GAT GAGCAAGT GGT GGGGAC GC CC 1322 
II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II III 

1264 AAAGCCTT GACCTT CAT GAAGGAC C ATT T T CT GAT GGAT GAGCAC GT GGT AGGAACACC C 1323 

1323 CTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTGGAGACAGCCCAGGGCCTT 1382 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

1324 CTGCTGGTGAAGTCTGGTGTGGAGTACACACGGCTTGCTGTGGAGTCAGCTCGGGGCCTT 1383 

1383 GAT GGGCACAGC CAT CTT GT CAT GT ACCT GGGAAC C ACCACAGGGT C GCT C C ACAAGGCT 14 42 

I I I I I I I I I I I I I I I I I I I I II I I I I I III I I I I I I I II II I I I I I I I I I 

1384 GAT GGGAGCAGC CAT GT GGT CAT GT AT CTGGGT AC CTCCACGGGGTCCCTGC ACAAGGCT 14 43 

1443 GT GGTAAGT GGGGAC AGCAGT GCT CAT CT GGTGGAAGAGAT T CAGCT GT T C C CTGAC C CT 1502 

IMM I I I I I I I I I I I II I I I I I Mill I I I I I I I I I I I I I I I I I I I II 

1444 GTGGTGCCTCAGGACAGCAGTGCTTATCTCGTGGAGGAGATTCAGCTGAGCCCTGACTCT 1503 

1503 GAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTGTAGGCTTCTCA 1562 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1504 GAGCCTGTTCGAAACCTGCAGCTGGCCCCCGCCCAGGGTGCAGTGTTTGCAGGCTTCTCT 1563 

1563 GGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACTGT 1622 

I I I I I I I I I I I I II II I I I I I I I II II I I I I I I I I I I I I I I I I I I II I I I I 

1564 GGAGGCAT CT GGAGAGTT C CCAGGGCCAAT T GCAGT GT CT ACGAGAGCT GT GT GGACT GT 1623 

1623 GTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCTG 1682 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II III I I I I I I I 

1624 GTGCTGCNCAGGGACCCTCACTGTGCCTGGGACCCTGAATCAAGACTCTGCAGCCTTCTG 1683 

1683 TCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACCCAGAGTGGGCA 1742 

I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1684 TCTGGCTCTACC AAGCCTTGGAAGCAGGACATGGAACGCGGCAACCCGGAGTGGGTA 1740 

1743 TGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGCAAATCATTAAA 18 02 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III III I I I I I I I 
1741 TGCACCCGTGGCCCCATGGCCAGGAGCCCCCGGCGTCAGAGCCCCCCTCAACTAATTAAA 1800 

1803 GAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACCTGTCAGCCTTG 1862 

I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I II 

1801 GAAGTCCTGACAGTCCCCAACTCCATCCTGGAGCTGCCCTGCCCCCACCTGTCAGCACTG 1860 

1863 GCCT CTT ATT AT T GGAGT CAT GGCC C AGCAGCAGT C C C AGAAGC CT CTT C C ACT GT CTAC 1922 

I I I I I I I I I I I I I I I I I I I II I III I II I I I I I I I I I I I I II I I I I I I 

1861 GCCTCTTACCACTGGAGTCATGGCCGAGCCAAAATCTCAGAAGCCTCTGCTACCGTCTAC 1920 

1923 AATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACCAGTGCTGGGCA 1982 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I III 

1921 AATGGCTCCCTCTTGCTGCTGCCGCAGGATGGTGTCGGGGGCCTCTACCAGTGTGTGGCG 1980 

1983 ACT GAGAAT GGCTTTTCAT ACCCT GT GAT CT CCT ACT GGGT GGACAGCC AGGAC CAGACC 2042 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

1981 ACT GAGAAC GGCTACTCAT ACCCT GT GGT CT CCT ATT GGGT AGACAGCC AGGAC CAGC CC 2040 

2043 CTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGACC 2102 

I I I I I I I I I I I I I I I II I I I III I I I I I I I I I I I I I I II I I I I I I I II I I 

2041 CTGGCGCTGGACCCTGAGCTGGCGGGCGTTCCCCGTGAGCGTGTGCAGGTCCCGCTGACC 2100 



Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 



2103 AGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCACT 2162 

I I I I I I I II II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I III III 

2101 AGGGTCGGAGGCGGAGCTTCCATGGCTGCCCAGCGGTCCTACTGGCCCCATTTTCTCATC 2160 

2163 GTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCGTGGCCTCCCCA 2222 

III I I I I I I 11 I I I I I I I I I II II I I I 

2161 GTTACCGTCCTCCTGGCCATCGTGCTCCTGGGAGTGCTCACTCTCCTCCTCGCTTCCCCA 2220 



2223 



2282 



TTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAG 

II I II II I I I I I I I I I I I I I I I I I I I I I I I II I I II MM III I I II 
222 1 CTGGGGGCGCTGCGGGCTCGGGGTAAGGTTCAGGGCTGTGGGATGCTGCCCCCCAGGGAA 2280 



2283 



AAGGCC C CGTTAAGCAGAGAGCAACAC CT CC AGT CT C C CAAGGAATGCAGGAC CTCT GC C 2342 

II II I I I I M M I I I I I I I I II I I II I II I II II M I I I II I II I I I 

2281 AAG GCT C C ACT GAGC AGG GACCAGC AC CT CCAGC C CT C CAAGG AC CACAGGAC CT C T GC C 2340 

2343 AGT GAT GTGGAC GCT GACAACAACT GC CT AGGCACT GAG GT AGCT TAAACT CT AGGCACA 2402 

II I I I II M II I I I I I I I I I II II I I II II II I II I M 
2341 AGTGACGTAGAT GCCGACAACAACCATCT GGGCGCCGAAGT GGCTTAAACAGGGACACAG 2400 

2403 GGCCGGGGCT — GCGGTGCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCC 2460 

III III I I I I I I I I I I I I II II II II I II 
2401 ATCCGCAGCTGAGCAGAGCAAGCCACTGGCCTTGTTGGCTATGC 



2444 



2461 TGACTAGGATGACAGCAGCACAAAAGACCACCTTT CTCCCCT GAGAGGAGCTT CTGCTAC 2520 

II I I II M I I I I I I I I M II I I 

2445 CAGGCACAGTGCCACTCTGACCAGGGTAGGAGGCTCTCCTGCTAA 2489 

2521 TCTGCATCACTGATGACACTCAGCAGGGTGATGCACAGCAGTCTGCCTCCCCTATGGGAC 2580 

II II I I I I II I I I I I I I I II I I I I I II II I 

2490 C GT GT GT C AC CT ACAGCACC CAGT AGGT CCTCCCCTGTGGGAC 2532 

2581 TCCCTTCTACCAAGCACATGAGCTCTCTAACAGGGTGGGGGCTACCCCCAGACCTGCTCC 264 0 

I I II II I I I I I I I I I I I I I I I I II I I 

2533 TCTCTTCTGCAAGCACATTGGGCTGTCT CCATACCTGTACT 2573 

2641 T AC ACT GAT ATT GAAGAAC CT GGAGAGGAT CCTT CAGTT CT GGC CAT T C CAGGGAC CCT C 2700 

I III I II II I I I I I I II I I I II I II I M M I 

2574 T GT GCT GTGACAGGAAGAGC CAGAC AGGTTT CTT T GATT TT GATT GAC C CAAGAGC C CT C 2633 

2701 CAGAAAC AC AGT GTTT CAAGAGAC CCTAAAAAAC CT GC CTGT CC C AGGAC C CT AT GGTAA 2760 

I I I I I I I II I I II III I I II I I I II I I 

2634 CTGTAACAAACGT GCT CCAGGAGACC AT GAAAGGT GT GGCT GTCT GGGATT CT GT GGT GA 2693 

2761 T GAACACCAAACATCTAAACAAT CATATGCTA AC ATGC C ACT C CT GGAAACT C 2813 

II I I II I I I I I I I I I I I I I II Ml I 

2694 CAAAC-CTAAGCATCCGAGCAAGCTGGGGCTATTCCTGCAAACTCCATCCTGAACGCTGT 2752 

2814 CACTCT GAAGCTGCCGCTTTGGACACCAACACTCCCTTC-TCCCAGGGTCATGCAG 2868 

I I I II I I I I I II I II I I II I I I II I I I I II I I I I I II I I I 

2753 CACT CTAGAAGC AGCT GCT GCTTT GAACAC CAGCC C AC CCT C CT T CC CAAGAGT CT CT AT 2812 

2869 GGATCTGCTCCCTCCTGCTTCCCTTACCAGTCGTGCACCGCTGACTCCCAGGAAGTCTTT 2928 

III M MM I I I I II I I I I II I I I I I I III I I I II I I I I 

2813 GGAGTTGGCCCCTTGTGTTTCCTTTACCAGTCATGCCATACTGTTT GGGAAGT CAT C 2869 



Qy 2929 CCTGAAGTCTGACCACCTTTCTTCTTGCTTCAGTTGGGGCAGACTCTGATCCCT TCT 2985 

11 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I 
Db 2870 TCT GAAGT CTAAC C ACCTT C CTT CT T GCT T CAGT T T GGACAGATT GTT AT TAT T GT CT CT 2929 

Qy 2986 GCCCTGGC-AGAATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTTTACCCTAGCTGACC 3044 

I I I I I II I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 2930 GCCCTGGCTAGAATGGGGGGCATAATCTGAGCCTTGTTCCCTTGTCCAGTGTGGCTGACC 2989 

Qy 3045 CCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAAACTGCTTGTCAGAG 3104 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2990 CTTGACCTCTT — CCTTCCTCCTCCCTTTGTTTGGGGATTCAGAAAACTGCTTGTCACAG 3047 

Qy 3105 ACTGTTTATTTTTTATTAAAAA 3126 

II I I I I I I I I I I I I I I I I I I 
Db 304 8 ACAATTTATTTTTTATTAAAAA 3069 
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DEFINITION 

ACCESSION 
VERSION 
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SOURCE 
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AUTHORS 



TITLE 
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REFERENCE 
AUTHORS 



TITLE 
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COMMENT 

FEATURES 

source 



gene 
ORIGIN 



AY402623 2172 bp DNA linear GSS 12-DEC-2003 

Mus mus cuius HCM1285 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY402623 

AY402623 . 1 GI : 39758609 
GSS. 

Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 

1 (bases 1 to 2172) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu, F. , Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T . J. , Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp -mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 2172) 

Clark, A. G., Glanowski, S . , Nielson,R., Thomas, P., Ke jariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D. R. , Lu, F. , Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualifiers 
1. .2172 

/organism="Mus musculus" 
/mol_type= "genomic DNA" 
/db_xref="taxon: 10090" 
<1. .>2172 

/locus_tag="HCM1285" 



Query Match 43.7%; Score 1372.2; DB 9; Length 2172; 

Best Local Similarity 71.9%; Pred. No. 0; 

Matches 1560; Conservative 0; Mismatches 611; Indels 0; Gaps 



0; 



Qy 105 ATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTCTTCCAA 164 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGCCCTACCATCCCTGGGCCAGGACTCATGGAGTCTCCTGCGTGTTTTTTTCTTCCAA 60 

Qy 165 CTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCCATGCCC 224 

II I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 CTCTTCCTGCTGCCATCACTGCCACCTGCTTCTGGGACTGGTGGTCAGGGGCCCATGCCC 120 

Qy 225 AGGGT CAGATACT AT GCAGGGGAT GAAC GT AGGGCACT T AGCTT CTTC CAC CAGAAGGGC 284 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 121 AGAGT CAAATAC CAT GCT GGAGAC GGGC ACAGGGC C CT CAGC TT CTT C CAACAAAAAGGC 180 

Qy 285 CTCCAGGATTTTGACACTCTGCTCCTGAGTGGTGATGGAAATACTCTCTACGTGGGGGCT 344 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 181 CT C C GAGACT TT GACACGCT GCTC CT GAGT GAC GAT GGCAACACT CT CT AT GT GGGGGCT 240 

Qy 345 C GAGAAGCCATT CTGGCCTTGGATATCCAGGAT C CAGGGGT C CC C AGGCTAAAGAACAT G 404 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 C GAGAGGCC GT C CTGGCCTT GAAT AT CCAGAAC CC AGGAAT C CCAAGGCTAAAGAACAT G 300 

Qy 4 05 AT AC C GT GGC CAGCCAGT GAC AGAAAAAAGAGT GAAT GT GC CTTTAAGAAGAAGAGCAAT 4 64 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 ATACCCTGGCCAGCCAGTGAGAGAAAAAAGACCGAAT GT GC CTTTAAGAAGAAGAGCAAT 360 

Qy 465 GAGACAC AGT GTTTCAACTT CATC C GT GT C CT GGT T T CT T ACAAT GT CAC C CAT CT CT AC 524 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I II II I I I I I 

Db 361 GAGACACAGT GTTTCAACTT CATT C GAGT C CT GGT CT CTT ACAAT GCT ACT CAC CT CTAT 420 

Qy 525 ACCT GCGGCACCT TCGCCT T C AGCC CT GCTT GT AC CTT CAT T GAACTT CAAGAT T C CTAC 584 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 GCCTGTGGGACCTTTGCCTTCAGCCCTGCCTGTACCTTCATTGAACTCCAAGATTCCCTC 4 80 

Qy 585 CT GTT GCCCAT CT CGGAGGACAAGGTCAT GGAGGGAAAAGGC CAAAGC CCCTTT GAC C C C 64 4 

I II I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I 

Db 481 CT GTT GC C CAT CTT GAT AGACAAGGTCAT GGAC GGGAAGGGC CAAAGC CC CTTT GAC C CT 54 0 

Qy 645 GCT CACAAGC AT ACGGCT GT CT TGGTGGAT GGGAT GCT CTAT T CT GGT ACT AT GAACAAC 704 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I 

Db 541 GTTCACAAGCACACAGCTGTCTTGGTCGATGGGATGCTTTATTCCGGCACCATGAACAAC 600 

Qy 705 TTC CT GGGCAGTGAGC CCATCCT GAT GC GCAC ACT GGGAT C CCAGCCT GT C CT CAAGAC C 764 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 TTC CT GGGC AGC GAGC CCAT C CT GAT GC GGAC ACT GGGAT C C CAGCCT GTT CT CAAGACT 660 

Qy 765 GACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCTTCGACC 824 

I I I I I I I I I I I I I I I I I I I I 

Db 661 GACATCTTCTTACGCTGGCTGCACGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 720 

Qy 825 CAGGT C GT CT ACT TCTT CTTC GAGGAGACAGC CAGC GAGTTT GACTT CTTT GAGAGGCT C 884 

Db 721 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 780 

Qy 885 CACACAT C GCGGGTGGCT AGAGT CT GCAAGAAT GAC GT GGGC GGC GAAAAGCT GCT GCAG 944 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 



781 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 840 

945 AAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGCAGCTGCCC 1004 

841 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 900 

1005 TTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCTCCCACAGCTCCCCACATC 1064 

901 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 960 

1065 TACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACCAGGAGCTCTGCGGTTTGTGCC 1124 

I I I I I I I I I I I I I I I I I 1 I I I I I I II II I I I I I I 

961 NNNNNNNNNNNNNNNNNNNNNNNGCAGGTTGGCGGGACCAGGAGCTCAGCAGTCTGTGCC 1020 

1125 TT CT CT CT CTT GGACAT T GAAC GT GT CTTTAAGG GGAAAT ACAAAGAGTT GAACAAAGAA 1184 

I I I I I I I I I II I I I I I I I II I I I I I I I I I II I I I I I II Ml I I I I I I I I I 

1021 TT CT CT CTC AC GGACAT T GAGC GAGT CTTTAAAGGGAAGT ACAAGGAGCT GAACAAG GAG 1080 

1185 ACTT CAC GCT GGACT ACTTATAGGGGC CCT GAGACCAAC C CC C GGC C AGGC AGTT GCT CA 1244 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

1081 AC CT C C C GCTGGACCACTT AC CGGGGCTCAGAGGT CAGC CC GAGGCCAGGC AGTTGCT C C 1140 

1245 GT GGGC C CCT C CTCT GATAAGGC CCT GAC CT T CAT GAAGGAC CATTT CCT GATG GAT GAG 1304 

I I I I I I I I I I I I I I I I II III I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I 

1141 ATGGGCCCCTCCTCT GACAAAGCCTT GACCTTCAT GAAGGAC CATTTTCT GATGGAT GAG 1200 

1305 CAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTGGAGTATACACGGCTTGCAGTG 1364 

II Mill II II I I I II I II II II II II II I I M I II II II M M M II I III 

1201 CACGTGGTAGGAACACCCCTGCTGGTGAAGTCTGGTGTGGAGTACACACGGCTTGCTGTG 1260 

1365 GAGACAGCCCAGGGC CTTGAT GGGCAC AGC CAT CTT GT CAT GT AC CT G GGAAC CAC CAC A 1424 

Ml I I I I I I I I I I I I I I II I I II I I I II I I I II I II I Mill III I I II 

1261 GAGTCAGCTCGGGGCCTTGATGGGAGCAGCCATGTGGTCATGTATCTGGGTACCTCCACG 1320 



1425 



GGGT C GCTC C ACAAGGCT GT GGTAAGT GGGGACAGCAGT GCT CAT CT GGT GGAAGAGAT T 1484 

Mill II I I II II I I II I I M I II I I I II I II I II I I I I I II II II II II 

1321 GGGTCCCTGCACAAGGCTGTGGTGCCTCAGGACAGCAGTGCTTATCTCGTGGAGGAGATT 1380 

1485 CAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCA 1544 

II II II I II II II II I I I I I II I M II M I I II II II II M M II II II I I II I 

1381 CAGCTGAGCCCTGACTCTGAGCCTGTTCGAAACCTGCAGCTGGCCCCCGCCCAGGGTGCA 1440 

1545 GT GTT T GTAGGCTT CT C AGGAGGT GT CTGGAGGGT GC CC C GAGCCAACT GT AGT GT CT AT 1604 

II II M I I II I I I I I I II II I II I I I M II Ml I II II I II I I II II M 
1441 GTGTTTGCAGGCTTCTCTGGAGGCATCTGGAGAGTTCCCAGGGCCAATTGCAGTGTCTAC 1500 

1605 GAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCC 1664 

II II II II I II I I I II I I II I I I I II I II I II I I I II I I I II I I I I I I I II II II 
1501 GAGAGCTGTGTGGACTGTGTGCTTGCCAGGGACCCTCACTGTGCCTGGGACCCTGAATCA 1560 

1665 CGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGG 1724 

M II I II I I I M I I I I I I I I I I II I II II II II I II I I I II 
1561 AGACTCTGCAGCCTTCTGTCTGGCTCTACCAACAGGCCTTGGAAGCAGGACATGGAACGC 1620 

1725 GGGAACC CAGAGTGGGCAT GT GCCAGT GGC CC CAT GAGC AGGAGCCTT C GGC CT CAGAGC 1784 
M I I I I I I I II I I I Ml M II I I I I II I I I II I II II I II II M II I I I 



Db 



1621 



GGCAACCCGGAGTGGGTATGCACCCGTGGCCCCATGGCCAGGAGCCCCCGGCGTCAGAGC 1680 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1785 CGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGC 1844 

I III III I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

1681 CCCCCTCAACTAATTAAAGAAGTCCTGACAGTCCCCAACTCCATCCTGGAGCTGCCCTGC 1740 

1845 CCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAA 1904 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I III I II I I I I I 
1741 CC C CAC CT GT CAGC ACT GGCCT CT T AC C ACT GGAGT CAT GGCC GAGC CAAAAT CT CAGAA 1800 

1905 GCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGT 1964 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I 

18 01 GCCTCTGCTACCGTCTACAATGGCTCCCTCTTGCTGCTGCCGCAGGATGGTGTCGGGGGC 1860 

1965 CTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTG 2024 

I I I II I I I I II III I I I I I I I I II I I I I I I I I I I I I II I I I I I. I I I I II I 
18 61 CTCTACCAGTGTGTGGCGACTGAGAACGGCTACTCATACCCTGTGGTCTCCTATTGGGTA 1920 

2025 GACAGCCAGGACCAGACCCTGGCCCTGGATCCTGAACTGGCAGGCATCCCCCGGGAGCAT 2084 

I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I III I II I II MM I 

1921 GACAGCCAGGACCAGCCCCTGGCGCTGGACCCTGAGCTGGCGGGCGTTCCCCGTGAGCGT 1980 

2085 GTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTAC 2144 

III I I I II II I I I II II I I I II I II M II II II I I I II I M I I II I M M 

1981 GTGCAGGTCCCGCTGACCAGGGTCGGAGGCGGAGCTTCCATGGCTGCCCAGCGGTCCTAC 204 0 

2145 TGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATC 2204 

I M I I I I I I II I II II I I I II I II I I II I II I I I II I I M M 

2041 TGGCCCCATTTTCTCATCGTTACCGTCCTCCTGGCCATCGTGCTCCTGGGAGTGCTCACT 2100 

2205 ATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGTGAG 2264 

II I I I I II II I I I I II I II II I II I II I II II II I I I I II II I II I II I 
2101 CTCCTCCTCGCTTCCCCACTGGGGGCGCTGCGGGCTCGGGGTAAGGTTCAGGGCTGTGGG 2160 

2265 ACCCTGCGCCC 2275 

I I I I I I II 

2161 ATGCTGCCCCC 2171 
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BX367242 1108 bp mRNA linear EST 27-APR-2004 

BX367242 Homo sapiens B CELLS (RAMOS CELL LINE) COT 25-NORMALIZED 
Homo sapiens cDNA clone CS0DL002YO04 3-PRIME, mRNA sequence. 
BX367242 

BX367242.2 GI:46625363 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 1108) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 

On May 8, 2003 this sequence version replaced gi: 30455608. 
Contact : Genoscope 



Genoscope - Centre National de Sequencage 

2 rue Gaston Cremieux, CP 5706 - 91057 EVRY cedex - FRANCE 
Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 
1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. This sequence belongs to sequence cluster 
907. f 

For more information about this cluster, see 
http : //www. genoscope . ens . f r/cdna?s=CSOAL002BH02NPl&c=907 . f . 
FEATURES Location/Qualifiers 
source 1. .1108 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon:9606" 
/clone="CS0DL002YO04" 

/cell_type="B CELLS (RAMOS CELL LINE) COT 25-NORMALIZED" 
/cell_line="RAM0S CELL LINE" 

/clone_lib="Homo sapiens B CELLS (RAMOS CELL LINE) COT 
25-NORMALIZED" 

/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 

ORIGIN 



Query Match 30.2%; Score 950.6; DB 5; Length 1108; 

Best Local Similarity 94.8%; Pred. No. 4.1e-240; 

Matches 996; Conservative 24; Mismatches 27; Indels 4; Gaps 4; 



Qy 


2073 


CCCCGGGAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCC 


2132 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 I 1 1 1 1 1 1 1 1 : 1 1 1 1 1 1 1 1 II 1 : 1 1 1 1 : 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1049 


CCCCCGGAGCATGT-AAGGTCCCGTTGACMAGGGTCAGTGG-KGGGCSGCCCTGGCTGCC 


992 


Qy 


2133 


CAGCAGTCCTACTGGCCCC-ACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTC 


2191 






1 1 1 : 1 1 1 1 : : 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 




Db 


991 


CAGMAGTCMYACTTGCCCCAACTTTGTAACTGTAACTGTCCTCTTTGCCTAAGTGCTTTC 


932 


Qy 


2192 


AGGAGCCCTCATCATCCTCGTGGCCTCCCC-ATTGAGAGCACTCCGGGCTCGGGGCAAGG 


2250 






1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 : 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


931 


AGGAGCCCTCATCATCCTCGTGGCCTCCCCAATTGAGAGMACTCCGGGCTCGGCGCAAGG 


872 


Qy 


2251 


T T CAGGGCT GT GAGACC CT GC GCCCT GGGGAGAAGGC CC CGTTAAGCAGAGAGCAAC AC C 


2310 




II : 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 II 




Db 


871 


TTMAGGGCT GT GAGACC CT GC GCCCT GGGGAGAAGGC CC C GTTAAGCAGAGAGCAAC AC C 


812 


Qy 


2311 


T CC AGT CTCC CAAGGAATGC AGGACCT CT GCCAGT GAT GT GGAC GCT GACAACAACT GCC 


2370 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


811 


T CCAGT CT C C CAAGGAATGCAGGAC CT CT GC C AGT GAT GT GGACGCTAACAACAACT GC C 


752 


Qy 


2371 


TAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCACCTGGC 


2430 






1 1 1 1 1 1 1 1 1 1 1 1 1 : 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


751 


TAGGCACTGAGGTMGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCACCTGGC 


692 


Qy 


2431 


C ATGCT GGCT GGGCGGC CCAAGCACAGCCCT GACT AGGAT GAC AGCAGCACAAAAGAC C A 


2490 



I I I I I I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I I I 



Db 



691 CATGCTGGCTGGGCGGCCCAAGMACAGCCCTGACTAGGATSACAGCAGCACAAAAGACCA 632 



Qy 


2491 


Db 


631 


Qy 


2551 


Db 


571 


Qy 


2611 


Db 


511 


Qy 


2671 


Db 


451 


Qy 


2731 


Db 


391 


Qy 


2791 


Db 


331 


Qy 


2851 


Db 


271 


Qy 


2911 


Db 


211 


Qy 


2971 


Db 


151 


Qy 


3031 


Db 


91 


Qy 


3091 


Db 


31 



CCTTTCTCCCCTGAGAGGAGCTTCTGCTACTCTGCATCACTGATGACACTCAGCAGGGTG 2550 

I I I I I I I I I I I I I I I I I I M II I II I I I I hi I I I I 1:1 MINI 

CCTTTCTCCCCTGAGAGGAGCTTCTGCTACTCTGCATMACTGATVACACTCAGCAGGGTG 572 

ATGCACAGCAGTCTGCCTCCCCTATGGGACTCCCTTCTACCAAGCACATGAGCTCTCTAA 2610 

III I I I I I II I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I II I I I I I I I I I I I 
ATGAACAGCAGTCTGCCTCCCCTATGGAACTCCCTTCTACCAAGCACATGAGCTCTCTAA 512 

CAGGGT GGGGGCT ACC CCCAGACCT GCT CCT AC ACT GAT AT TGAAGAACCT GGAGAGGAT 2670 
I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAGGGT GGGGGCT AC CCCCAGACCT GCTCCTAAACT GAT ATTGAAGAACCT GGAGAGGAT 452 

C CTT CAGTTCT GGCCAT T C CAGGGACC CT CC AGAAAC AC AGTGT T T CAAGAGACC CTAAA 2730 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

C CTT CAGTTCT GGCCAT T C CAGGGACC CT CC AGAAAC ACAGTGT T T CAAGAGAC CCTAAA 392 

AAAC CT GC CTGT C C C AGGAC CCT AT GGTAAT GAAC ACCAAACAT CTAAACAAT CAT AT GC 2790 

I I I I I I I I : I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I III MINI 
AAACCTGCMTGTCCCAGGACCCTATGGTAATGAACACCAAACAT CTAAAAAATAATAT GC 332 

TAACATGCCACTCCTGGAAACTCCACTCTGAAGCTGCCGCTTTGGACACCAACACTCCCT 2850 

111:1111 I I I I I I I II I I I I I : I : I I I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I 
TAAMATGCAACTCCTGGAAACTCMAMTCTGAAGCTGCCGCTTTGAAMACCAAAACTCCCT 272 

TCTCCCAGGGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCAGTCGTGCACCGCT 2910 

II I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I I I I I I I II I I I I : I I II I I I : I I III 

T CT CC CAGGGT CAT GMAG GGAT CT GCT C C CT C CT GCT T C C CTT ACMAGT C GT GMACAGCT 212 , 

GACTCCCAGGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCTTCAGTTGGGGCAG 2970 

I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I : I I 

AACT C C C AGGAAGT CTT C C CT GAAGT CT GAC CAC CTTT CNT CT AG CTTAAGTT GGRGAAA 152 

ACTCTGATCCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCCTTCTTCACTCCTT 3030 

I I I II I I I I I II I I I I I I II I 1 I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I II I I I I 
ACTCTGATCCCTTCTGCCCTGGCAGAATGGCAGGGGTAATNTGAGCCTTCTTAACTCCTT 92 

TACCCTAGCTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAA 3090 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TACCCTAGCTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTTTGGGATTCAGAAA 32 

ACTGCTTGTCAGAGACTGTTTATTTTTTATT 3121 

I I I I I I I I I I I I I I I I I I I II : : I I I I II 

ACTGCTTGTCAGAGACTGTTTCBYTTTTCTT 1 



RESULT 9 

BX363741/C 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



BX363741 1064 bp mRNA linear EST 23-APR-2004 

BX363741 Homo sapiens B CELLS (RAMOS CELL LINE) COT 25-NORMALIZED 
Homo sapiens cDNA clone CS0DL005YC17 3-PRIME, mRNA sequence. 
BX363741 

BX363741.2 GI: 46554166 
EST. 

Homo sapiens (human) 
Homo sapiens 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 1064) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 

On May 5, 2003 this sequence version replaced gi: 30384744. 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 

2 rue Gaston Cremieux, CP 5706 - 91057 EVRY cedex - FRANCE 
Email: seqref @genoscope . ens . f r , Web : www.genoscope.cns.fr 

1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies , a 
division of Invitrogen. This sequence belongs to sequence cluster 
907. f 

For more information about this cluster, see 

http : //www. genoscope . ens . f r/cdna?s=CSODL005AB09NPl&c=907 . f . 
Location/Qualifiers 
1. .1064 

/organism= M Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="CS0DL005YC17 " 

/cell_type="B CELLS (RAMOS CELL LINE) COT 25-NORMALIZED" 
/ eel l_line=" RAMOS CELL LINE" 

/clone_lib="Homo sapiens B CELLS (RAMOS CELL LINE) COT 
25-NORMALIZED" 

/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



ORIGIN 



Query Match 29.5%; Score 926.2; DB 5; 

Best Local Similarity 95.5%; Pred. No. 1.2e-233; 
Matches 1000; Conservative 15; Mismatches 24; 



Length 1064; 
Indels 8; 



Gaps 



6; 



Qy 

Db 

Qy 

Db 

Qy 

Db 



2058 GAACTGGCAGGCATCCCCCGGGAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGG 2117 

I I I I I I I I I I II II : I : I I I I I I I I I I I I : I I I I I I I I I I I II 

1040 GATCTGAATGGCAGCATCCCCGGGAGMWGKGARGTCCCGTTGACC-RGGTCAGTGGTGGG 982 

2118 GCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCCACTTTGTCACTGTCACTGTCCTCTTT 2177 
I II I : I I I I I I I I I I I I : I : I I III I I I I I I I I I I I I I I I I I I I I I I I I 
981 — C C GCC CT GG YGC C CAGCAGT CCWAYTG — CCCCATTTGTCACTGTCACTGTCCTCTTT 926 

2178 GCCTT AGT GCTTT CAGGAGCC CT CAT CAT C CT CGT GGC CT CCC CATT GAGAGCACT CC GG 2237 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

925 GCCTTAGTGCTTTCA-GAGCCCTCATCATCCTCGT-GCCTCCCCATTGAGAGCACTCCGG 868 



Qy 2238 GCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGC 2297 

I I I I I I I I I I I I I II I I II I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 867 GCTCGGGGCAAGGTTCAGGGCTGTGAGACCCTGCGCCCTGGGGAGAAGGCCCCGTTAAGC 808 



Qy 



2298 AGAGAGCAACACCT CCAGT CT CC CAAGGAAT GCAGGACCT CT GC CAGT GAT GT GGAC GCT 2357 
I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 



Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 
Db 



807 AGAGAGCAAC AC CT C CAGT CT CCCAAGGAAT GC AGGAC CT CT GC CAGT GAT GT GGAC GCT 74 8 

2358 GACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGT 2417 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I II I I I I I I I I I I I I I I I 

747 GACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGT 688 

2418 GCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCTGACTAGGATGACAGCA 2477 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCAGGCACCTGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCTGACTAGGATGACAGCA 62 8 



687 



2478 GCACAAAAGACCACCTTTCTCCCCTGAGAGGAGCTT CT GCT ACT CTGCAT CACTGAT GAC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
627 GCACAAAAGACCAC CTTT CTCC CCT GAGAGGAGCT T CT GCT ACT CT GC AT C ACT GAT GAC 

2538 ACTCAGCAGGGTGATGCACAGCAGTCTGCCTCCCCTATGGGACTCCCTTCTACCAAGCAC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I 
567 ACT CAGC AGGGTGAT GCACAGCAGT CT GCCT C C CCT AT GGGAC T CC CTT CT ACCAAG CAC 

2598 AT GAGCT CTCTAACAGGGT GGGGGCT AC CCCC AGACCT GCT CCT AC ACT GAT AT T GAAGA 
I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
507 AT GAGCT CTCTAACAGGGT GGGGGCTAC C CC C AGAC CT GCT CCT AC ACT GAT AT T GAAGA 



2537 



568 



2597 



508 



2657 



448 



2658 ACCT GGAGAGGAT C CTT CAGTTCT GGC C ATT C CAGGGAC CCT C CAGAAACAC AGT GTT T C 2717 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I 
447 AC CT GGAGAGGAT C CTT CAGTT CT GGC C ATT C CAGGGAC C CTC CAGAAACAC AGT GTTT C 388 

2718 AAGAGAC C CTAAAAAACCT GCCTGT C C C AGGAC CCT AT GGTAAT GAACAC CAAAC AT CT A 2777 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
387 AAGAGAC C CTAAAAAAC CT GC CTGT C CCAGGAC C CT AT GGTAAT GAACAC CAAAC AT CT A 328 

2778 AACAATC ATAT GCTAACAT GC CACT CCT GGAAACT C C ACT CTGAAGCT GC CGCT T TGGAC 2837 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
327 AACAAT C ATAT GCTAACAT GC CACT C CT GGAAACT C CACT CTGAAGCT GC CGCT T TG GAC 2 68 

2838 ACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCA 2897 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
267 ACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCA 208 

2898 GTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCT 2957 

I I I I I I I I I I I I I I I I I : I I I I I I I I II I I I I I I I I : I I II I I I I II I I I I I I II I I I I 
207 GTCGTGCACCGCTGACTYCCAGGAAGTCTTCCCTGAAKTCTGACCACCTTTCTTCTTGCT 148 

2958 TCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGG-CAGGGGTAATCTGAGC 3016 

I I I I I I I I I I I I I I : I : I I I I I I II I I I I I I I I I I : I I I I I I I I I I I I I I I I I I II I II 
147 TCAGTTGGGGCAGAYTYTGATCCCTTCTGCCCTGGYAGAATGGTCAGGGGTAATCTGAGC 88 

3017 CTTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTT 3076 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I : I I I I I I I I I : I : : I I I I I I I I I I I I I 
87 CTTCTTCACTCCTTTACCCTAGCTGACCCCTTCMCCTCTCCCCBTSSCTTTTCCTTTGTT 28 

3077 TTGGGATTCAGAAAACTGCTTGTCAGA 3103 
I I I I I I I I I II I I I I I I I I I I I I I I I I 
27 TTGGGATTCAGAAAACTGCTTGTCAGA 1 



RESULT 10 
BX350606/C 



LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



GI:30373499 



BX350606 922 bp mRNA linear EST 08-APR-2004 

BX350606 Homo sapiens B CELLS (RAMOS CELL LINE) COT 25-NORMALIZED 
Homo sapiens cDNA clone CS0DL005YC17 3-PRIME, mRNA sequence. 
BX350606 
BX350606.1 
EST. 

Homo sapiens 
Homo sapiens 
Eukaryota; Metazoa; 
Mamma 1 i a ; Eu t he r i a ; 
1 (bases 1 to 922) 
Li, W.B. , Gruber,C. , 



(human) 



Chordata; 
Primates; 



Craniata ; Vertebrata ; Euteleos tomi ; 
Catarrhini; Hominidae; Homo. 

and Polayes,D. 



Jessee, J. 

Full-length cDNA libraries and normalization 
Unpublished (2001) 
Contact : Genoscope 

Genoscope - Centre National de Sequencage 

2 rue Gaston Cremieux, CP 5706 - 91057 EVRY cedex - FRANCE 
Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 
1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. This sequence belongs to sequence cluster 
907. f 

For more information about this cluster, see 

http : //www. genoscope . ens . f r/cdna?s=CS0BAI043ZD06_CS04076_l&c=907 . f . 
Location/Qualifiers 
1. .922 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="CS0DL005YC17" 

/cell_type="B CELLS (RAMOS CELL LINE) COT 25-NORMALIZED" 
/cell_line-"RAMOS CELL LINE" 

/clone_lib="Homo sapiens B CELLS (RAMOS CELL LINE) COT 
25-NORMALIZED" 

/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



ORIGIN 



Query Match 27.8%; 
Best Local Similarity 98.7%; 
Matches 878; Conservative 



Score 874.4; DB 5 
Pred. No. 6.1e-220 
0; Mismatches 12 



Length 922; 

Indels 0; Gaps 0; 



Qy 1372 C C C AGGGC CTTGAT GGGCACAGCCATCT T GT CAT GT AC CT GGGAACCACCACAGGGT C GC 1431 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 919 CCCAGGNCCTTGATGGGCACAGCCATCTTGTCATGTACTTGGGAACCACAACAGGGTCGC 860 



Qy 1432 TC CACAAGGCT GT GGTAAGT GGGGACAGC AGT GCT CAT CT GGT GGAAGAGATT CAGCT GT 1491 

I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I 
Db 859 TCCACAAGACTGT GGTAAGT GGGGACAGCAGT GCT CATCTGGTGGAAGAGATTCAGCT GT 800 



Qy 

Db 



1492 
799 



TCCCTGACCCTGAACCTGTTCGCAACCTGCAGCTGGCCCCCACCCAGGGTGCAGTGTTTG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TCCCTGACCCTGANCCTGTTCGCAACCTGCAGCTGGCCNCCACCAAGGGTGCAGTGTTGN 



1551 
740 



Qy 1552 TAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTGTAGTGTCTATGAGAGCT 1611 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 739 TAGGCTTCTCAGNAGGTGTCTGGAGGGTGCNCCGAGCCAACTGTAGTGTCTATGAGAGCT 680 

Qy 1612 GTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCT 1671 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I 
Db 67 9 GTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGACCCTGAGTCCCGAACCT 620 

Qy 1672 GTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACC 1731 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 619 GTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGACATGGAGCGGGGGAACC 560 

Qy 1732 CAGAGT GGGCAT GTGC CAGTGGCC C CAT GAGCAGGAGC CTT C GGCCT CAGAGC C GC CCGC 1791 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 559 CAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCGGCCTCAGAGCCGCCCGC 500 

Qy 17 92 AAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGAGCTCCCCTGCCCCCACC 1851 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 499 AAATCATTAAAGAAGTCCTGGCTGTCCCTAACTCCATCCTGGAGCTCCCCTGCCCCCACC 44 0 

Qy 1852 TGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGCAGTCCCAGAAGCCTCTT 1911 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 439 T GT CAGC CTT GGC CT CTT ATT AT T GGAGT CAT GGC C CAGCAGCAGT C CCAGAAGCCT CT T 380 

Qy 1912 CCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACC 1971 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 
Db 379 CCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGGAGTTGGGGGTCTCTACC 320 

Qy 1972 AGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCC 2031 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 319 AGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTCCTACTGGGTGGACAGCC 260 

Qy 2032 AGGACC AGACCCT GG C CCT GGATC CT GAACT GGCAGG CAT CC CCC GGGAGC AT GT GAAGG 2091 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 259 AGGAC CAGACCCT GGC CCT GGAT CCT GAACT GGCAGGCAT C C C C C GG GAG CAT GT GAAGG 200 

Qy 2092 TCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCC 2151 

I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 199 TCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCAGCAGTCCTACTGGCCCC 140 

Qy 2152 ACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCG 2211 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 139 ACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGGAGCCCTCATCATCCTCG 80 

Qy 2212 TGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGT 2261 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 79 TGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTCAGGGCTGT 30 



RESULT 11 

BX384966 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 



BX384966 934 bp mRNA linear EST 23-APR-2004 

BX384966 Homo sapiens B CELLS (RAMOS CELL LINE) COT 25-NORMALIZED 
Homo sapiens cDNA clone CS0DL005YC17 5-PRIME, mRNA sequence. 
BX384966 

BX384966.2 GI: 46556002 



KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; 
Mammalia; Eutheria; 
1 (bases 1 to 934) 
Li,W.B. , Gruber, C. , 



FEATURES 

source 



Craniata ; Vertebrata ; Euteleos tomi ; 
Primates; Catarrhini; Hominidae; Homo. 



and Polayes,D. 



Jessee, J. 

Full-length cDNA libraries and normalization 
Unpublished (2001) 

On May 8, 2003 this sequence version replaced gi:30436505. 
Contact : Genoscope 

Genoscope - Centre National de Sequencage 

2 rue Gaston Cremieux, CP 5706 - 91057 EVRY cedex - FRANCE 
Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 
1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. This sequence belongs to sequence cluster 
907. f 

For more information about this cluster, see 

http: //www. genoscope. ens . f r/cdna?s=CS0DL005AB09QPl&c=907 . f . 
Location/Qualifiers 
1. .934 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref =" taxon : 9606" 
/clone="CS0DL005YC17" 

/cell_type="B CELLS (RAMOS CELL LINE) COT 25-NORMALIZED" 
/cell_line="RAMOS CELL LINE" 

/clone_lib="Homo sapiens B CELLS (RAMOS CELL LINE) COT 
25-NORMALIZED" 

/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



ORIGIN 



Query Match 27.0%; 
Best Local Similarity 97.0%; 
Matches 871; Conservative 



Score 849.2; DB 5; 
Pred. No. 2.9e-213; 
4; Mismatches 22; 



Length 934; 



Indels 



1; Gaps 



l; 



Qy 

Db 



99 CTGAGCATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTC 158 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1 CTGAGCATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCTTTTCCTC 60 



Qy 



Db 



159 TTCCAACTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCC 218 
I I I I II ! I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 TTCCAACTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCAGGGGCCC 120 



Qy 

Db 



219 ATGCCCAGGGTCAGATACTATGCAGGGGATGAACGTAGGGCACTTAGCTTCTTCCACCAG 278 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 1 I I I I I I I 
121 AT GCC C AGGGTCAGAT ACT AT GCAGGGGATGAAC GT AGGGCACTT AGCTT CT T C CAC C AG 180 



Qy 279 AAGGGCCT CC AGGATTT TGACACT CT GCT CCT GAGT GGTGATGGAAAT ACT CT CT ACGT G 338 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 181 AAGGGC CT CCAGGATTTT GACACT CT GCT CCT GAGT GCT GATGGAAAT ACT CT CT AC GT G 240 



Qy 339 GGGGCTCGAGAAGCCATTCTGGCCTTGGATATCCAGGATCCAGGGGTCCCCAGGCTAAAG 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 GGGGCTCGAGAAGCCATTCTGGCCTTGGATATCCAGGATCCAGGGGTCCCCAGGCTAAAG 



398 
300 



Qy 399 AACAT GAT ACCGT GGC CAGCCAGT GAC AGAAAAAAGAGT GAAT GT GC CTTT AAGAAGAAG 458 

I I I II I I I I I I I I I I II I I II II I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I 

Db 301 AACAT GAT AC C GT GG C C AGC C AGT GAC AG AAAAAAG AGT GAAT GT G C C T T T AAGAAGAAG 360 

Qy 459 AGCAAT GAGACACAGT GTTTCAACTT CAT CC GT GT CCT GGTT TCT T ACAAT GT CAC C CAT 518 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 AGCAAT GAGACACAGT GTTTCAACTT CAT CCGT GT C CT GGTTT CT T ACAAT GT CAC C CAT 420 

Qy 519 CTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGAT 578 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 CTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACTTCAAGAT 480 

Qy 579 TCCTACCTGTTGCCCATCTCGGAGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTT 638 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 TCCTACCTGTTGCCCATCTCGGAGGACAAGGTCATGGAGGGAAAAGGCCAAAGCCCCTTT 540 

Qy 639 GACCCCGCTCACAAGCATACGGCTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATG 698 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 GACCCCGCTCACAAGCATACGGCTGTCTTGGTGGATGGGATGCTCTATTCTGGTACTATG 600 

Qy 699 AACAACTT CCTGGGC AGT GAGC C CAT C CT GAT GC G C ACACT GGGAT CC CAGCCT GT C CT C 758 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I 

Db 601 AACAACTTCCTGGGCAGTGAGCCCATCCTGATGCGCACACTGGGATCCCAGCCTGTCCTC 660 

Qy 759 AAGACCGACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCT 818 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 AAGACCGACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGCCATCCCT 720 

Qy 819 T C GAC CCAGGTCGTCT ACT TCTT CT T C GAGGAGAC AGC CAGC GAGTTT GACTT CT T T GAG 878 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 TCGACCCAGGTCGTCTACTTCTTCTTCGAGGAGACAGCCAGCGAGTTTGACTTCTTTGAG 780 

Qy 87 9 AGGCTCCACACATCGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGCGAAAAGCTG 938 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I : I I I 

Db 781 AGGCTCCACACATCGCGGGTGGCTAGAGTCTGCAAGAATGACGTGGGCGGCG-AAARCTG 839 

Qy 939 CTGCAGAAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACCCAGCCGGGGC 996 

I I I I I I I I I I I I I I I I I I : I I I I I llll: : I I I I I II 

Db 840 CTGCAGAAGAAGTGGACCMCCTCCTGAAGCCCACYGCYCTCMCCAGCCCGGGCACTGC 897 



RESULT 12 

BX328255 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



BX328255 897 bp mRNA linear EST 07-APR-2004 

BX328255 Homo sapiens B CELLS (RAMOS CELL LINE) COT 25-NORMALIZED 
Homo sapiens cDNA clone CS0DL005YC17 5-PRIME, mRNA sequence. 
BX328255 

BX328255.2 GI: 46262160 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 897) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 

On May 1, 2003 this sequence version replaced gi: 30307730. 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 

2 rue Gaston Cremieux, CP 5706 - 91057 EVRY cedex - FRANCE 
Email: seqref @genoscope • ens . f r, Web : www.genoscope.cns.fr 

1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. This sequence belongs to sequence cluster 
907. f 

For more information about this cluster, see 

http://www.genoscope.cns . f r/cdna?s=CS0BAG053ZH06_CS05040_l&c=907 . f . 
Location/ Qualifiers 
1. .897 

/organism="Homo sapiens" 
/mol__type="mRNA" 
/db_xref="taxon:9606" 
/clone="CS0DL005YC17" 

/cell_type="B CELLS (RAMOS CELL LINE) COT 2 5 -NORMALIZED 11 
/cell_line="RAMOS CELL LINE" 

/clone_lib="Homo sapiens B CELLS (RAMOS CELL LINE) COT 
25-NORMALIZED" 

/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



ORIGIN 



Query Match 26.7%; 
Best Local Similarity 99.0%; 
Matches 886; Conservative 



Score 839; DB 5; Length 8 97; 
Pred. No. 1.5e-210; 
0 ; Mismatches 5 ; Indels 



4 ; Gaps 



4; 



Qy 

Db 



805 T GGCAGCCATC CCT TCGAC C C AGGT C GT CT ACTT CTT CTT CGAGG- AGAC AGC CAGCGAG 
I I I I I I I I II I I I I I I I II I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1 T GGCAGCCATCC CT TCGAC C C AGGT C GT CT ACT T CTT CTT CGAGGAAGACAGCCAGCGAG 



863 



60 



Qy 
Db 

Qy 

Db 



864 T TT GACTT CTT T GAGAGGCT C CAC ACAT C GC GGGT GGCTAGAGT CT GCAAGAAT GAC GT G 923 
I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

61 TTTGACTTCTTTGAGAGGCTCCACACATCGCGGGTGGCTAGAGTCTGCAAGAATGACGTG 120 

924 GGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGC 983 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

121 GGCGGCGAAAAGCTGCTGCAGAAGAAGTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGC 180 



Qy 

Db 



984 ACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGAT 1043 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
181 ACCCAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGAT 24 0 



Qy 1044 TCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACC 1103 

I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I 
Db 241 TCTCCCACAGCTCCCCACATCTACGCAGTCTTCACCTCCCAGTGGCAGGTTGGCGGGACC 300 



Qy 1104 AGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTTTAAGGGGAAA 1163 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I 
Db 301 AGGAGCTCTGCGGTTTGTGCCTTCTCTCTCTTGGACATTGAACGTGTCTTTAAGGGGAAA 360 

Qy 1164 TACAAAGAGT TGAACAAAGAAACTT CAC GCT GGAC TACT TAT AGGGGC CCT GAGAC CAAC 1223 

I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 TACAAAGAGTTjGAACAAAGAAACTTCACGCTGGACTACTTATAGGGGCCCTGAGACCAAC 420 

Qy 1224 CCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGATAAGGCCCTGACCTTCATGAAG 1283 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CCCCGGCCAGGCAGTTGCTCAGTGGGCCCCTCCTCTGATAAGGCCCTGACCTTCATGAAG 4 80 

Qy 1284 GACCAT T TC CTGAT GGAT GAGCAAGTGGT GGGGACGCC CCT GCT GGT GAAAT CT GGC GT G 1343 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 GACCATTTCCTGATGGATGAGCAAGTGGTGGGGACGCCCCTGCTGGTGAAATCTGGCGTG 54 0 

Qy 1344 GAGT ATACAC GGCTT GCAGTGGAGAC AGC CCAGGGC CT T GAT GGGCAC AGC CAT CTT GT C 1403 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 GAGT ATACAC GGCTT GCAGTGGAGACAGCCCAGGGCCTTGATGGGCACAGCCATCTTGT C 600 

Qy 1404 AT GT AC CTGGGAACCAC CACAGGGT C GCT CCACAAGGCT GT GGTAAGT GGGGAC AGCAGT 14 63 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 ATGTACCTGGGAACCACCACAGGGTCGCTCCACAAGGCTGTGGTAAGTGGGGACAGCAGT 660 

Qy 1464 GCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAG 1523 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 GCTCATCTGGTGGAAGAGATTCAGCTGTTCCCTGACCCTGAACCTGTTCGCAACCTGCAG 720 

Qy 1524 CTGGCCCCCACCCAGGGTGCA-GTGTTTGTAGGCTTCTCAGGAGGTGTCTGG-AGGGTGC 1581 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CTGGCCCCCACCCCAGGTGCANGTGTTTGTAGGCTTCTCAGGAGGTGTCTGGNAGGGTGC 7 80 

Qy 1582 CCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCC 1641 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 CCCGAGCCAACTGTAGTGTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCCGGACCCCC 84 0 

Qy 1642 ACTGTGCCTGGGACCCTGAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAACCT 1696 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 -CTGTGCCTGGGACCCTGAGTCCCGACCCTGTTGCCTTCTGTCTGCCCCCAACCT 894 



RESULT 13 

BQ057192 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 



BQ057192 974 bp mRNA linear EST 29-MAR-2002 

AGENCOURT_6769628 NIH_MGC_99 Homo sapiens cDNA clone IMAGE: 5812383 
5', mRNA sequence. 
BQ057192 

BQ057192 .1 GI : 19816532 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 974) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 



JOURNAL Unpublished (1999) 
COMMENT Contact: Robert Strausberg, Ph.D. 

Email : cgapbs-r@mail . nih . gov 
Tissue Procurement: Lou Staudt 
cDNA Library Preparation: Rubin Laboratory 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/LLNL at: 
http : //image . llnl . gov 
Plate: LLCM2062 row: 1 column: 16 
High quality sequence stop: 714. 
FEATURES Location/Qualifiers 
source 1. .974 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon:9606" 
/clone=" IMAGE: 5812383" 
/tissue_type="lymphoma, cell line" 
/lab_host="DH10B (phage-resistant ) " 
/ cl one_l ib= " N I H_MGC_9 9 " 

/note="Organ: lymph; Vector: pOTB7; Site_l: Xhol; Site_2: 
EcoRI; cDNA made by oligo-dT priming. Directionally cloned 
into EcoRI/XhoI sites using the following 5 ! adaptor: 
GGCACGAG(G). Size-selected >500bp for average insert size 
1.8kb. Library constructed by Ling Hong in the laboratory 
of Gerald M. Rubin (University of California, Berkeley) 
using ZAP-cDNA synthesis kit (Stratagene) and Superscript 
II RT (Life Technologies) . Note: this is a NIH_MGC 
Library. " 

ORIGIN 



Query Match 26.3%; Score 827.4; DB 5; Length 974; 

Best Local Similarity 92.6%; Pred. No. 1.8e-207; 

Matches 902; Conservative 0; Mismatches 67; Indels 5; Gaps 3; 



Qy 


92 


TCTGTGGCTGAGCATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCT 


151 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1 


TCTGTGGCTGAGCATGGCCCTCCCAGCCCTGGGCCTGGACCCCTGGAGCCTCCTGGGCCT 


60 


Qy 


152 


TTTCCTCTTCCAACTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCA 


211 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


61 


TTTCCTCTTCCAACTGCTTCAGCTGCTGCTGCCGACGACGACCGCGGGGGGAGGCGGGCA 


120 


Qy 


212 


GGGGCCCATGCCCAGGGTCAGATACTATGCAGGGGATGAACGTAGGGCACTTAGCTTCTT 


271 






1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 




Db 


121 


GGGGCCCATGCCCAGGGTCAGATACTATGCAGGGGATGAACGTAGGGCACTTAGCTTCTT 


180 


Qy 


272 


CCAC CAGAAGGGCCT CCAGGATTT T GAC ACT CT GCT CCT GAGTGGTGATGGAAAT ACT CT 


331 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i I 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


181 


CCAC CAGAAGGGCCT CCAGGATTTT GAC ACT CT GCT C CT GAGTGGTGATGGAAAT ACT CT 


240 


Qy 


332 


CTACGTGGGGGCTCGAGAAGCCATTCTGGCCTTGGATATCCAGGATCCAGGGGTCCCCAG 


391 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 




Db 


241 


CTACGTGGGGGCTCGAGAAGCCATTCTGGCCTTGGATATCCAGGATCCAGGGGTCCCCAG 


300 


Qy 


392 


GCTAAAGAACATGATACCGTGGCCAGCCAGTGACAGAAAAAAGAGTGAATGTGCCTTTAA 


451 



Db 



301 



I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCTAAAGAACATGATAC C GTGGCCAG C C AGT GACAGAAAAAAGAGT GAAT GT GCCTT TAA 360 



Qy 452 GAAGAAGAGCAATGAGACACAGTGTTT CAACTTCAT CCGT GTCCTGGTTT CTTACAAT GT 511 

I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GAAGAAGAGCAATGAGACACAGTGTTT CAACTTCAT CCGT GTCCTGGTTT CTTACAAT GT 420 

Qy 512 CACCCATCTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACT 571 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 CACCCATCTCTACACCTGCGGCACCTTCGCCTTCAGCCCTGCTTGTACCTTCATTGAACT 480 

Qy 572 TCAAGATTCCTACCTGTT GCCCATCTCGGAGGACAAGGT CATGGAGGGAAAAGGCCAAAG 631 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 4 81 TCAAGATTCCTACCTGTT GCCCATCTCGGAGGACAAGGT CATGGAGGGAAAAGGCCAAAG 540 

Qy 632 CCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGTGGATGGGATGCTCTATTCTGG 691 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 

Db 541 CCCCTTTGACCCCGCTCACAAGCATACGGCTGTCTTGGTGGATGGGATGCTCTATTCTGG 600 

Qy 692 TACTATGAACAACTTCCTGGGCAGTGAGCCCATCCTGATGCGCACACTGGGATCCCAGCC 751 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 601 TACTATGAACAACTTCCTGGGCAGTGAGCCCATCCTGATGCGCACACTGGGATCCCAGCC 660 

Qy 752 TGTCCTCAAGACCGACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGC 811 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 TGTCCTCAAGACCGACAACTTCCTCCGCTGGCTGCATCATGACGCCTCCTTTGTGGCAGC 720 

Qy 812 CATCCCTTCGACCCAGGTCGTCTACTTCTTCTTCGAGGAGACAGCCAGCGAGTTTGACTT 871 

I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CAT C C CT T CGACC CAGGT C GT CT ACT T C T T CT T CG GAGAGACAGCC AG C GAGTT T GACTT 780 

Qy 872 CTTTGAGAGGCTCCACACATCGCGGGTGG-CTAGAGTCTGCAAGAATGACGTGGGC-GGC 92 9 

I I I I I I I I I I I II I II I I I I II III I I I I I I I I I I I I I I I I I I II III 

Db 781 CTTTGAGAGGCCCCCACCCTCCCGGGGGGCCTANAGTCTGCCAAAATGACGTGGGCGGGC 840 

Qy 930 GAAAAGCT GCT GCAGAAGAA GTGGACCACCTTCCTGAAGGCCCAGCTGCTCTGCACC 986 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 841 GAAAAGCTGCTGCAAAAAAAAGTGGACCCCCCTTCCTTGAAGGCCCAGCTGCTCTGGCCC 900 

Qy 987 CAGCCGGGGCAGCTGCCCTTCAACGTCATCCGCCACGCGGTCCTGCTCCCCGCCGATTCT 104 6 

I I I I I I I III I II I I I I I I I I I 

Db 901 CCAGCCGGGGGGAGCTTGCCCTTTCACGTCATTCCCGCCCCCGGGGTCCTGGCTCCCCCC 960 

Qy 1047 CCCACAGCTCCCCA 1060 

III I I I I I I 

Db 961 CCGAATTTTCCCCA 974 



RESULT 14 

BX390196 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 



BX390196 944 bp mRNA linear EST 29-APR-2004 

BX390196 Homo sapiens NEUROBLASTOMA COT 50-NORMALIZED Homo sapiens 
cDNA clone CS0DD003YE08 5-PRIME, mRNA sequence. 
BX390196 

BX390196.2 GI : 46873199 
EST. 

Homo sapiens (human) 



ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 944) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 

On May 8, 2003 this sequence version replaced gi: 30463276. 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 

2 rue Gaston Cremieux, CP 5706 - 91057 EVRY cedex - FRANCE 
Email: seqref ©genoscope . ens . f r, Web : www.genoscope.cns.fr 

1st strand cDNA was primed with a Notl-oligo (dT) primer. Five prime 
end enriched, double-strand cDNA was digested with Not I and cloned 
into the Not I and EcoR V sites of the pCMVSPORT 6 vector. Library 
was normalized. Library was constructed by Life Technologies, a 
division of Invitrogen. This sequence belongs to sequence cluster 
907. f 

For more information about this cluster, see 

http://www.genoscope.cns. fr/cdna?s=CSOBAG009ZD12_CS00860_l&c=907. f. 
Location/Qualifiers 
1. .944 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="CS0DD003YE08" 

/tissue_type= "NEUROBLASTOMA COT 50-NORMALIZED" 
/clone_lib="Homo sapiens NEUROBLASTOMA COT 50-NORMALIZED" 
/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



ORIGIN 



Query Match 26.1%; 
Best Local Similarity 97.4%; 
Matches 897; Conservative 



Score 820.4; DB 5; 
Pred. No. 1.3e-205; 
0; Mismatches 17; 



Length 944; 



Indels 



7 ; Gaps 



6; 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1535 CCAGGGTGCAGTGTTTGTAGGCTTCTCAGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTG 1594 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1 CCAGGGTGCAGTGTTTGTAGGCTTCT-AGGAGGTGTCTGGAGGGTGCCCCGAGCCAACTG 59 

1595 TAGTGTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGA 1654 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
60 TAGTGTCTATGAGAGCTGTGTGGACTGTGTCCTTGCCCGGGACCCCCACTGTGCCTGGGA 119 

1655 CCCTGAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGA 1714 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
120 CCCTGAGTCCCGAACCTGTTGCCTCCTGTCTGCCCCCAACCTGAACTCCTGGAAGCAGGA 179 

1715 CAT GGAGCGGGGGAACCC AGAGT GGGCAT GTGC CAGT GGC C CC AT GAGC AGGAGC CTT CG 1774 

I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I M I I I I I I I i I I I I I 

180 CATGGAGCGGGGGAACCCAGAGTGGGCATGTGCCAGTGGCCCCATGAGCAGGAGCCTTCG 239 



Qy 1775 GCCTCAGAGCCGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCCAACTCCATCCTGGA 1834 

M M I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 240 GCCTCAGAGCCGCCCGCAAATCATTAAAGAAGTCCTGGCTGTCCCTAACTCCATCCTGGA 299 



Qy 1835 GCTCCCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGC 1894 

I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 300 GCTCCCCTGCCCCCACCTGTCAGCCTTGGCCTCTTATTATTGGAGTCATGGCCCAGCAGC 359 

Qy 1895 AGTCCCAGAAGCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGG 1954 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 360 AGTCCCAGAAGCCTCTTCCACTGTCTACAATGGCTCCCTCTTGCTGATAGTGCAGGATGG 419 

Qy 1955 AGTTGGGGGTCTCTACCAGTGCTGGGCAACTGAGAATGGCTTTTCATACCCTGTGATCTC 2014 

I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 420 AGTT GGGGGT CT CT ACCAGT GCT GGGCAACT GAGAATGGCTTTT CAT ACC CT GT GAT CT C 479 

Qy 2015 CTACTGGGTGGACAGCCAGGACCAGACCCTGGCCCTGGATCCTGAACTGGCAGGCATCCC 2074 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 480 CTACTGGGTGGACAGCCAGGACCAGACCCTGGCCCTGGATCCTGAACTGGCAGGCATCCC 539 

Qy 2075 CCGGGAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCA 2134 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 540 CCGGGAGCATGTGAAGGTCCCGTTGACCAGGGTCAGTGGTGGGGCCGCCCTGGCTGCCCA 599 

Qy 2135 GCAGTCCTACTGGCCCCACTTTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGG 2194 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 600 GCAGTCCTACTGGCCCCACTNTGTCACTGTCACTGTCCTCTTTGCCTTAGTGCTTTCAGG 659 

Qy 2195 AGCCCTCATCATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTCGGGGCAAGGTTC- 2253 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 660 AGCCCTCATCATCCTCGTGGCCTCCCCATTGAGAGCACTCCGGGCTTCGGGCAAGGTTCA 719 

Qy 2254 AGGGCTGTGAGACCCTGCGCCCTGGGG — AGAAGGCCCCGTTAAGCAGAGAGCAACA-CC 2310 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 720 AGGGCT GT GAGAC C CT GCGC C CT GGGGGAGAAGGGC C C C GT TAAGCAGAGAGCAACAC CC 779 

Qy 2311 T CC AGT CT C CCAAGGAAT GCAGGAC CTCT GC CAGT GAT GT GGAC G- CT GACAACAACT GC 2369 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I 
Db 780 T T CAGT CT CC CAAGGAAT GCAGGACCT CT GCCAGT GATGT GGGCGCCT GACAACAACT GC 839 

Qy 2370 CTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGTGCAGGCACCTGG 2429 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M I I I I I I I I I I I I I I I 
Db 840 CTAGGCACTGAGGTAGCTTAAACTCTA-GCACAGCCCGGGCTTGCGGGGCAGCCACCTGC 898 

Qy 2430 CCATGCTGGCTGGGCGGCCCA 2450 

I I I I I I I I I I I I I I I I I I I 
Db 899 CCATGCTGTGTGGGCGGCCCA 919 



RESULT 15 

CB243787/c 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



797 bp mRNA 
.si UI-CF-FN0 Homo 
3', mRNA sequence, 



linear EST 12-FEB-2003 
sapiens cDNA clone 



CB243787 

UI-CF-FN0-agg-a-05-0-UI 
UI-CF-FN0-agg-a-05-0-UI 
CB243787 

CB243787.1 GI: 28365431 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 



REFERENCE 
AUTHORS 
TITLE 

JOURNAL 
MEDLINE 
PUBMED 
COMMENT 



FEATURES 

source 



Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 797) 

Bonaldo, M. F. , Lennon,G. and Soares,M.B. 

Normalization and subtraction: two approaches to facilitate gene 
discovery 

Genome Res. 6 (9), 791-806 (1996) 

97044477 

8889548 

Contact: McCray, PB 
McCray Lab 
University of Iowa 

2024 University of Iowa Med Labs, Iowa City, IA 52242, USA 

Tel: 319 356 4866 

Fax: 319 356 7171 

Email : paul-mccray@uiowa . edu 

Tissue Procurement: Dr. M. J. Welsh, University of Iowa 
cDNA Library preparation: Dr. M. Bento Soares, University of Iowa 
cDNA Library Arrayed by: Dr. M. Bento Soares, University of Iowa 
DNA Sequencing by: Dr. M. Bento Soares, University of Iowa 
Clone Distribution: Researchers may obtain clones from Research 

Genetics (www.resgen.com) or from Open Biosystems 

(www.openbiosystems.com) . 

The following repetitive elements were found in this cDNA 
sequence: 1-4 6, >AT_rich#Low_complexity (matched compliment) 
Seq primer: M13 FORWARD 
P0LYA=Yes . 

Location/Qualifiers 

1. .797 

/organisra="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="UI-CF-FN0-agg-a-05-0-UI" 
/tissue__type="Human Lung Epithelial cells" 

/lab_host="DH10B (Life Technologies) (Tl phage resistant)" 
/clone_lib="UI-CF-FNO" 

/note="0rgan: Lung; Vector: pT7T3-Pac (Pharmacia) with a 
modified polylinker; Site_l : EcoR I; Site_2 : Not I; 
UI-CF-FNO is a subtracted cDNA library derived from two 
normalized Human lung epithelial cell libraries (EN1 and 
DU1) The library was subtracted according to according to 
Bonaldo, Lennon and Soares, Genome Research, 6:791-806, 
1996. For additional information, contact: 
bento-soares@uiowa . edu 

TAG_TISSUE=Human Lung Epithelial Cell Lines untreated LPS 
6hr to LPS 24h 
TAG_LIB=UI-CF-FNO 
TAG S EQ=CT GCTCAGGT " 



ORIGIN 



Query Match 24.8%; 
Best Local Similarity 99.4%; 
Matches 781; Conservative 



Score 779.8; DB 6; 
Pred. No. 7e-195; 
0 ; Mismatches 5 ; 



Length 797; 



Indels 



0; Gaps 



0; 



Qy 2358 GACAACAACTGCCTAGGCACTGAGGTAGCTTAAACTCTAGGCACAGGCCGGGGCTGCGGT 2417 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I 
Db 797 GACAACAACTGCNTAGGCACTGAGGTAGCTTAAACTNTAGGCACAGGCCGGGGCTGCGGT 738 



Qy 


2418 


GCAGGCACCTGGCCATGC 1 Gbb 1 bbbCbbCC^AAbUAUAbUL-U 1 bALlAbbAi <j/\UM.bL,/\ 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 




Db 


737 


GCAGGCACCCGGCCATGCTGGCTGGGCGGCCCAAGCACAGCCCTGANTAGGATGACAGCA 


678 


Qy 


2478 


GCACAAAAGACCACCTTTCTCCCCTGAGAGGAGb 1 1 L 1 GC I AL ltl bLAI 1 bAl bAb 






1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 




Db 


677 


GCACAAAAGAC CAC CT TT CT C C CCT GAGAGGAGCT T CT GCT ACT CT GCAT C AC T GAT GAC 


618 


Qy 


2538 


ACT CAGCAGGGTGAT GCACAGCAGT CT GC CT C C CCT AT GGGACT CCCT T CT ACCAAGC AC 


OCQT 

zoy / 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


617 


ACT CAGCAGGGT GAT GCACAGCAGT CT GC CT CC CCT AT G GGACT CCCTT CT ACCAAGC AC 


558 


Qy 


2598 


AT GAGCT CT CTAACAGGGT GGGGGCTAC C C C C AGAC CT GCT CCT ACACT GAT ATT GAAGA 


2oo / 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


557 


AT GAGCT CTCTAACAGGGT GGGGGCTAC C C CCAGAC CT GCT CCT ACACT GAT ATT GAAGA 


498 


Qy 


2658 


AC CT GGAGAGGAT C CTT C AGT T CT GGC CAT T C C AGGGAC C CT C C AGAAAC AC AGT GT TT C 


271 / 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


497 


AC CT GGAGAGGAT C CTT CAGTT CT GGC C ATT C CAGGGAC CCTC C AGAAACACAGT GTTT C 


438 


Qy 


2718 


AAGAGACCCTAAAAAAC CT GC CTGT CC C AGGACCCT AT GGTAAT GAAC AC CAAACAT CT A 


2 / / / 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


437 


AAGAGAC CCTAAAAAACCT GCCTGT CCT AGGAC CCT AT GGTAAT GAAC AC CAAACAT CT A 


378 


Qy 


2778 


AACAAT CAT AT GCTAACAT GCCACT CCT GGAAACT C CACT CTGAAGCT GC C GCTT TGGAC 


O O O T 

Zoo f 




1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 II 1 




Db 


377 


AACAAT CAT AT GCTAACAT GCCACT CCT GGAAACT C CACT CTGAAGCT GC C GCTT TGGAC 


318 


Qy 


2838 


ACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCA 


O Q C\ T 

28 9/ 




I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


317 


ACCAACACTCCCTTCTCCCAGGGTCATGCAGGGATCTGCTCCCTCCTGCTTCCCTTACCA 


258 


Qy 


2898 


GTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCT 


o a c *7 




1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


257 


GTCGTGCACCGCTGACTCCCAGGAAGTCTTTCCTGAAGTCTGACCACCTTTCTTCTTGCT 


198 


Qy 


2958 


T CAGTT GGGGCAGACT CT GAT C CCTT CT GC C CT GGC AGAAT GGCAGGGGTAATCT GAGC C 


Jul / 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


197 


TCAGTTGGGGCAGACTCTGATCCCTTCTGCCCTGGCAGAATGGCAGGGGTAATCTGAGCC 


138 


Qy 


3018 


TTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTT 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


137 


TTCTTCACTCCTTTACCCTAGCTGACCCCTTCACCTCTCCCCCTCCCTTTTCCTTTGTTT 


78 


Qy 


3078 


T GGGATT CAGAAAACT GCTTGT CAGAGACT GT TT ATT T TTT AT T AAAAAT ATAAGGCTT A 


3137 




i i i i i i t i i i i i i i t i i i t i i i i i i i i i i i i t i i i i i i i i i i i i t i i i i i t i i i i i i i i i 
II 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


77 


TGGGATTCAGAAAACTGCTTGTCAGAGACTGTTTATTTTTTATTAAAAATATAAGGCTTA 


18 


Qy 


3138 


AAAAAA 3143 




Db 


17 


1 1 1 1 1 1 
AAAAAA 12 





Search completed: February 15, 2005, 13:17:35 
Job time : 9877 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2005 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 
Run on: 



Title: 

Perfect score: 
Sequence : 

Scoring table: 
Searched: 



February 14, 2005, 19:11:26 ; Search time 1686 Seconds 

(without alignments) 
10999.493 Million cell updates/sec 

US-10-015-391A-276 
3143 

1 gggctgaggcactgagagac aaatataaggcttaaaaaaa 3143 

I DENT I T Y_NUC 

Gapop 10.0 , Gapext 1.0 



5378673 seqs, 2950229984 residues 



Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 

Listing first 1500 summaries 



10757346 



Database 



Published__Applications_NA: * 

1 : /cgn2_6/ptodata/2/pubpna/US07_PUBCOMB. seq: * 

2 : /cgn2_6/ptodata/2/pubpna/PCT_NEW_PUB . seq: * 

3: /cgn2_6/ptodata/2/pubpna/US06_NEW_PUB. seq: * 

4 : /cgn2_6/ptodata/2/pubpna/US06_PUBCOMB. seq: * 

5 : /cgn2_6/ptodata/ 2 /pubpna/US 07_NEW_PUB. seq: * 

6: /cgn2_6/ptodata/2/pubpna/PCTUS_PUBCOMB.seq: * 

7: /cgn2_6/ptodata/2/pubpna/US08_NEW_PUB.seq:* 

8 : /cgn2_6/ptodata/2/pubpna/US08_PUBCOMB. seq: * 

9: / cgn2_6/ptodata/ 2 /pubpna/US 09AJPUBCOMB. seq:* 
10: /cgn2_6/ptodata/2/pubpna/US09B_PUBCOMB.seq:* 
11: /cgn2_6/ptodata/2/pubpna/US09C_PUBCOMB. seq:* 
12 : /cgn2_6/ptodata/2/pubpna/US09_NEW_PUB . seq: * 
13: /cgn2_6/ptodata/ 2 /pubpna/US 10A_PUBCOMB. seq:* 
14 : /cgn2_6/ptodata/2/pubpna/US10B_PUBCOMB. seq: * 
15: /cgn2_6/ptodata/2/pubpna/US10C_PUBCOMB. seq:* 
16: /cgn2_6/ptodata/2/pubpna/US10D_PUBCOMB. seq:* 
17: /cgn2_6/ptodata/2/pubpna/US10E_PUBCOMB. seq: * 
18: /cgn2_6/ptodata/2/pubpna/US10F_PUBCOMB.seq:* 
19: /cgn2_6/ptodata/2/pubpna/US10_NEW_PUB.seq:* 
20: / cgn2_6/p toda ta/ 2 /pubpna/US 1 1_NEW_PUB .seq:* 
21: / cgn2_6/p toda ta/ 2 /pubpna/US 60_NEW_PUB .seq:* 
22: /cgn2_6/ptodata/2/pubpna/US60_PUBCOMB.seq:* 

Pred. No. is the number of results predicted by chance to have a 

score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 



SUMMARIES 



% 

Result Query 

No. Score Match Length DB ID 



Description 





37 


3143 


100. 


0 


3143 


16 


US-1 0-013-9 09A-2 7 6 


Sequence 


276, App 




66 


3060 . 8 


97. 


4 


3505 


16 


US- 10-051-8 35- 13 


Sequence 


13, Appl 




67 


3040.8 


96.7 


3104 


10 


US-09-759-130B-387 


Sequence 


387, App 




68 


3040. 8 


96. 


7 


3104 


13 


US-10-042-431-17 


Sequence 


17, Appl 




69 


3040. 8 


96. 


7 


3104 


18 


US-10-741-790-387 


Sequence 


387, App 




70 


3035. 8 


96. 


6 


3191 


15 


US-10-050-882-11 


Sequence 


11, Appl 




71 


3029. 8 


96. 


4 


3042 


9 


US-09-774-434-5 


Sequence ! 


5, Appli 




72 


2860.4 


91. 


0 


3146 


18 


US-10-489-372-49 


Sequence 


49, Appl 




73 


2682.2 


85. 


3 


2981 


17 


US-10-104-047-319 


Sequence 


319, App 




74 


2476. 4 


78. 


8 


2768 


17 


US-10-470-360-35 


Sequence 


35, Appl 




75 


2437 


77. 


5 


2745 


18 


US-10-489-372-32 


Sequence 


32, Appl 




76 


2283 


72. 


6 


2283 


10 


US-09-759-130B-388 


Sequence 


388, App 




77 


2283 


72. 


6 


2283 


13 


US-10-042-431-18 


Sequence 


18, Appl 




78 


2283 


72. 


6 


2283 


18 


US-10-741-790-388 


Sequence 


388, App 


c 


79 


2281 


72. 


6 


2281 


17 


US-10-190-115-9 


Sequence 


9, Appli 


c 


80 


2281 


72. 


6 


2281 


17 


US-10-369-072-9 


Sequence 


9, Appli 




81 


2228.4 


70. 


9 


2271 


17 


US-10-190-115-7 


Sequence 


7, Appli 




82 


2228.4 


70. 


9 


2271 


17 


US-10-369-072-7 


Sequence 


7, Appli 




83 


2104.8 


67. 


0 


2238 


18 


US-10-489-372-50 


Sequence 


50, Appl 




84 


1727.6 


55. 


0 


3046 


10 


US-09-759-130B-447 


Sequence 


447, App 




85 


1727.6 


55. 


0 


3046 


13 


US-10-042-431-71 


Sequence 


71, Appl 




86 


1727.6 


55. 


0 


3046 


13 


US-10-042-431-77 


Sequence 


77, Appl 




87 


1727.6 


55. 


0 


3046 


18 


US-10-741-790-447 


Sequence 


447, App 




88 


1015. 8 


32. 


3 


1674 


9 


US-09-728-952-38 


Sequence I 


38, Appl 


c 


89 


576 


18. 


3 


576 


16 


US-10-029-386-25944 


Sequence 


25944, A 




90 


551 


17. 


5 


551 


9 


US-09-796-692-9413 


Sequence ! 


9413, Ap 




91 


551 


17. 


5 


551 


14 


US-10-040-862-9413 


Sequence 


9413, Ap 




92 


551 


17. 


5 


551 


17 


US-10-057-475B-9413 


Sequence 


9413, Ap 




93 


551 


17. 


5 


551 


17 


US-10-154-884B-9413 
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1419 
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3. 
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Sequence 


2800, Ap 
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Sequence 
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3. 
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Sequence 


45, 
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3, 
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1431 


98.6 


3. 


1 


1797 


9 
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Sequence - 


40, 


Appl 
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98 
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3. 


1 
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9 


US-09-854-845-44 


Sequence 44 , Appl 


1433 


98 


.6 


3. 


1 


2301 


9 


US-09-854-845-48 


Sequence 48, Appl 


1434 


98 


.6 


3. 


1 


2790 


14 


US-10-300-834-5 


Sequence 5, Appli 
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.6 


3. 


1 
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14 


US-10-300-834-4 


Sequence 4, Appli 


1436 
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.6 


3. 


0 
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9 


US-09-854-845-38 


Sequence 38, Appl 


1437 


95 


.6 


3. 


0 


2235 
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US-09-854-845-42 


Sequence 42, Appl 


1438 


95 


.6 


3. 


0 


2316 


9 


US-09-854-845-46 


Sequence 46, Appl 


1439 


92 


.8 


3. 


0 


729 
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Sequence 304, App 


1440 


92 
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3. 


0 


729 


14 


US-10-189-123-34 


Sequence 34, Appl 
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3. 


0 


729 
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Sequence 34, Appl 
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92 


.8 


3. 


0 


729 
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US-10-741-790-304 


Sequence 304, App 
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.8 


2. 


9 


2787 


14 


US-10-300-834-2 


Sequence 2, Appli 
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2. 


9 
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14 
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Sequence 1, Appli 
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89 


.4 


2. 


8 


4003 
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US-10-723-860-5060 


Sequence 5060, Ap 
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2. 


6 
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Sequence 11, Appl 
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2919 


16 
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Sequence 2, Appli 
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83 


2. 


6 


2919 


18 


US-10-669-176-11 


Sequence 11, Appl 
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79 


.6 


2. 


5 


2349 


9 


US-09-813-290-3 


Sequence 3, Appli 
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79 


.6 


2. 


5 


2628 


9 


US-09-813-290-1 


Sequence 1, Appli 
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79 


.6 


2. 


5 


3568 


9 
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Sequence 5, Appli 


1452 
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2. 


5 


4700 
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Sequence 1824, Ap 
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2. 
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4700 
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Sequence 1824, Ap 
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2. 


5 


4700 


18 


US-10-723-860-2944 


Sequence 2944, Ap 


1455 


79 


.6 


2. 


5 


4936 


18 


US-10-723-860-6994 


Sequence 6994, Ap 


1456 


78 


.6 


2. 


5 


3560 


16 


US-10-067-632-59 


Sequence 59, Appl 


1457 


78 


.2 


2. 


5 


1923 


18 


US-10-312-281-12 


Sequence 12, Appl 


1458 


78 


.2 


2. 


5 


1923 


18 


US-10-461-791-12 


Sequence 12, Appl 
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78 


.2 


2. 


5 
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US-10-312-281-5 


Sequence 5, Appli 
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Sequence 5, Appli 
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Sequence 3, Appli 
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US-09-854-845-20 


Sequence 20, Appl 
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76 


.6 


2. 


4 


1896 


17 


US-10-016-248-9 


Sequence 9, Appli 


1465 


76 


.6 


2. 


4 


2191 


17 


US-10-016-248-13 


Sequence 13, Appl 


1466 


76 


.6 


2. 


4 


2359 


17 


US-10-016-248-17 


Sequence 17, Appl 


1467 


76 


.6 


2. 


4 


3196 


17 


US-10-016-248-15 


Sequence 15, Appl 


1468 


76 


.6 


2. 


4 


3205 


17 


US-10-016-248-11 


Sequence 11, Appl 


1469 


76 


.6 


2. 


4 


3364 


17 


US-10-016-248-19 


Sequence 19, Appl 
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76 


.6 


2. 


4 


4234 


17 


US-10-451-010-12 


Sequence 12, Appl 
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76 


.2 


2. 


4 


2340 


9 
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Sequence 1, Appli 
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2. 


3 
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.4 


2. 


3 
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18 
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Sequence 8119, Ap 
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71 


.2 


2. 


3 


928 


14 
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Sequence 13, Appl 
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.2 


2. 


3 


1194 


9 


US-09-854-845-36 


Sequence 36, Appl 
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69 


.8 


2. 


2 


2670 


16 
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Sequence 61, Appl 


1477 
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2 
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14 


US-10-188-246-15 


Sequence 15, Appl 
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66 


.6 


2. 


1 


1755 


9 


US-09-978-249-4 


Sequence 4, Appli 
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65 


.2 


2. 


1 


648 


9 


US-09-854-845-18 


Sequence 18, Appl 
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63 
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2. 


0 
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14 
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Sequence 283, App 
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2. 
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0 
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1484 


63 


.8 
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0 
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Sequence 53, Appl 
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63 
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2. 


0 
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63 


.8 


2. 


0 


2848 


16 
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Sequence 83, Appl 
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63 


.8 


2. 


0 


3023 


18 


US-10-723-860-6714 


Sequence 6714, Ap 
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62 


2. 


0 


2854 


16 
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Sequence 57, Appl 
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17 
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1. 
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60 
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1. 


9 
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9 
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Sequence 34, Appl 
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1. 


8 
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17 
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Sequence 163, App 
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57.6 


1. 


8 


3552 


17 
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Sequence 437, App 
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57.6 


1. 


8 


3552 


18 


US-10-775-169-25 


Sequence 25, Appl 
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57.2 


1. 


8 
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10 
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Sequence 51, Appl 
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8 


48244 


17 
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Sequence 166, App 
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1. 


8 
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Sequence 5889, Ap 
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Sequence 385, App 
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